AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月18日 03:11·約1分で読める

AlibabaのオープンモデルQwen3.6、エージェントコーディングベンチマークでGoogleのGemma 4をリード

#LLM#オープンソース#ベンチマーク#Alibaba#モデル効率化#コーディングAI
TL;DR

AlibabaのオープンソースモデルQwen3.6-35B-A3Bは、350億パラメータのうち一度に3億パラメータのみを活性化する効率的な手法で、GoogleのGemma 4-31Bをコーディング・推論ベンチマークで上回った。

AI深層分析2026年4月18日 04:42
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

効率的なアーキテクチャによる性能向上

Qwen3.6-35B-A3Bは、350億パラメータのうち一度に3億パラメータのみを活性化する手法で、大規模モデルでありながら効率的な推論を実現している。

2

GoogleのGemma 4をベンチマークで上回る

Alibabaのモデルは、GoogleのGemma 4-31Bをコーディングと推論のベンチマークで凌駕する性能を示した。

3

オープンソースモデルの競争力

この成果は、オープンソースの大規模言語モデルが商用モデルと同等以上の性能を発揮できる可能性を示している。

4

エージェント的コーディング能力の評価

記事では特に「agentic coding benchmarks」での優位性が強調されており、自律的なコーディングタスク実行能力が評価されている。

影響分析・編集コメントを表示

影響分析

この記事は、オープンソースAIモデルの性能が商用モデルに匹敵する水準に達しつつあることを示しており、AI業界の競争構造に影響を与える可能性がある。特に中国企業の技術力向上と効率的なモデルアーキテクチャの重要性が浮き彫りになった。

編集コメント

オープンソースモデルの性能向上が顕著で、業界の競争をさらに加速させる可能性がある注目すべきニュース。特にパラメータ効率化技術の進展に注目したい。

image
image

Alibabaの新しいオープンソースモデル「Qwen3.6-35B-A3B」は、350億のパラメータのうち一度に3つだけを活性化させる仕組みにもかかわらず、コーディングと推論のベンチマークにおいて、Googleのより大規模なモデル「Gemma 4-31B」を上回る性能を示しました。

この記事「Alibaba's open model Qwen3.6 leads Google's Gemma 4 across agentic coding benchmarks」は、The Decoderで最初に公開されました。

原文を表示

Alibaba has released Qwen3.6-35B-A3B, a new open AI model. The mixture-of-experts model activates just three of its 35 billion parameters at a time, cutting compute costs without meaningfully hurting quality, according to Alibaba.

Alibaba says the model significantly outperforms its predecessor, Qwen3.5-35B-A3B, on agentic coding tasks. Against Google's open Gemma 4-31B, it leads every coding benchmark listed, scoring 73.4 to 52.0 on SWE-bench Verified and 51.5 to 42.9 on Terminal-Bench 2.0. It also edges ahead on reasoning tests like GPQA (86.0 to 84.3) and AIME26 (92.7 to 89.2). Alibaba claims it even keeps pace with Claude Sonnet 4.5 on image and video tasks.

Benchmark results show Qwen3.6-35B-A3B leading across coding, reasoning, and multimodal tests against Qwen3.5 and Google's Gemma 4 models. | Image: Alibaba / Qwen

The model offers both thinking and non-thinking modes. Users can try it in Qwen Studio, access it via API as Qwen3.6 Flash through Alibaba Cloud Model Studio, or download the weights from Hugging Face and ModelScope. The release follows the launch of the larger Qwen3.6-Plus.

AI News Without the Hype – Curated by Humans

Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.

Subscribe now

この記事をシェア

関連記事

Hugging Face Blog★42026年4月23日 09:00

Chrome拡張機能でTransformers.jsを使用する方法

開発者はChrome拡張機能にTransformers.jsを組み込み、ブラウザ上で機械学習モデルを実行する。これによりサーバー依存を排除し、プライバシー保護と低レイテンシを実現する実装手順を示す。

InfoQ★32026年4月24日 00:00

Google、Room 3.0を発表:Kotlinファーストの非同期マルチプラットフォーム永続化ライブラリ

GoogleはRoom 3.0を発表した。本バージョンは破壊的変更を導入し、Kotlin Multiplatform対応を強化するとともにJSとWasmへのサポートを追加した。

Simon Willison Blog2026年4月16日 01:41

Google の Gemini 3.1 Flash TTS モデルによる自然な音声合成ツール

Google は、単一話者および複数話者の会話モードに対応し、発声指示タグの適用も可能な「Gemini 3.1 Flash TTS」モデルを公開した。このツールにより、テキストから自然な音声を生成してダウンロードできるようになった。

ニュース一覧に戻る元記事を読む