AlibabaのオープンモデルQwen3.6、エージェントコーディングベンチマークでGoogleのGemma 4をリード
AlibabaのオープンソースモデルQwen3.6-35B-A3Bは、350億パラメータのうち一度に3億パラメータのみを活性化する効率的な手法で、GoogleのGemma 4-31Bをコーディング・推論ベンチマークで上回った。
キーポイント
効率的なアーキテクチャによる性能向上
Qwen3.6-35B-A3Bは、350億パラメータのうち一度に3億パラメータのみを活性化する手法で、大規模モデルでありながら効率的な推論を実現している。
GoogleのGemma 4をベンチマークで上回る
Alibabaのモデルは、GoogleのGemma 4-31Bをコーディングと推論のベンチマークで凌駕する性能を示した。
オープンソースモデルの競争力
この成果は、オープンソースの大規模言語モデルが商用モデルと同等以上の性能を発揮できる可能性を示している。
エージェント的コーディング能力の評価
記事では特に「agentic coding benchmarks」での優位性が強調されており、自律的なコーディングタスク実行能力が評価されている。
影響分析・編集コメントを表示
影響分析
この記事は、オープンソースAIモデルの性能が商用モデルに匹敵する水準に達しつつあることを示しており、AI業界の競争構造に影響を与える可能性がある。特に中国企業の技術力向上と効率的なモデルアーキテクチャの重要性が浮き彫りになった。
編集コメント
オープンソースモデルの性能向上が顕著で、業界の競争をさらに加速させる可能性がある注目すべきニュース。特にパラメータ効率化技術の進展に注目したい。

Alibabaの新しいオープンソースモデル「Qwen3.6-35B-A3B」は、350億のパラメータのうち一度に3つだけを活性化させる仕組みにもかかわらず、コーディングと推論のベンチマークにおいて、Googleのより大規模なモデル「Gemma 4-31B」を上回る性能を示しました。
この記事「Alibaba's open model Qwen3.6 leads Google's Gemma 4 across agentic coding benchmarks」は、The Decoderで最初に公開されました。
原文を表示
Alibaba has released Qwen3.6-35B-A3B, a new open AI model. The mixture-of-experts model activates just three of its 35 billion parameters at a time, cutting compute costs without meaningfully hurting quality, according to Alibaba.
Alibaba says the model significantly outperforms its predecessor, Qwen3.5-35B-A3B, on agentic coding tasks. Against Google's open Gemma 4-31B, it leads every coding benchmark listed, scoring 73.4 to 52.0 on SWE-bench Verified and 51.5 to 42.9 on Terminal-Bench 2.0. It also edges ahead on reasoning tests like GPQA (86.0 to 84.3) and AIME26 (92.7 to 89.2). Alibaba claims it even keeps pace with Claude Sonnet 4.5 on image and video tasks.
Benchmark results show Qwen3.6-35B-A3B leading across coding, reasoning, and multimodal tests against Qwen3.5 and Google's Gemma 4 models. | Image: Alibaba / Qwen
The model offers both thinking and non-thinking modes. Users can try it in Qwen Studio, access it via API as Qwen3.6 Flash through Alibaba Cloud Model Studio, or download the weights from Hugging Face and ModelScope. The release follows the launch of the larger Qwen3.6-Plus.
AI News Without the Hype – Curated by Humans
Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.
Subscribe now
関連記事
Chrome拡張機能でTransformers.jsを使用する方法
開発者はChrome拡張機能にTransformers.jsを組み込み、ブラウザ上で機械学習モデルを実行する。これによりサーバー依存を排除し、プライバシー保護と低レイテンシを実現する実装手順を示す。
Google、Room 3.0を発表:Kotlinファーストの非同期マルチプラットフォーム永続化ライブラリ
GoogleはRoom 3.0を発表した。本バージョンは破壊的変更を導入し、Kotlin Multiplatform対応を強化するとともにJSとWasmへのサポートを追加した。
Google の Gemini 3.1 Flash TTS モデルによる自然な音声合成ツール
Google は、単一話者および複数話者の会話モードに対応し、発声指示タグの適用も可能な「Gemini 3.1 Flash TTS」モデルを公開した。このツールにより、テキストから自然な音声を生成してダウンロードできるようになった。