Qwen3.6-35B-A3Bがオープンソース化!
アリババの通義大模型チームが、総パラメータ350億・推論時30億を活性化する軽量MoEモデル『Qwen3.6-35B-A3B』を完全オープンソースで公開し、コード生成とマルチモーダル性能で大型稠密モデルに迫る実力を示した。
キーポイント
軽量MoEアーキテクチャの実装
総パラメータ350億に対し推論時は約30億のみを活性化し、計算コストと速度の最適化を実現。
コード生成・エージェント性能の向上
SWE-benchやTerminal-Benchで前モデルを大幅上回り、270億パラメータの稠密モデルと互角以上の性能を達成。
多機能マルチモーダル対応
「思考/非思考」双モードを継承し、画像・ドキュメント解析や空間知能(RefCOCO等)で主要モデルと同等以上の精度を示す。
完全オープンソースとエコシステム連携
Hugging FaceとModelScopeで公開され、Claude CodeやOpenClawなどの主流プログラミングツールへの即座の統合が可能。
模型上线与preserve_thinking功能
模型已在阿里云百炼上线(qwen3.6-flash),支持保留前序轮次思维内容的preserve_thinking功能,专为智能体任务优化。
全面兼容主流API协议
支持OpenAI规范的聊天补全与响应API,以及Anthropic接口标准,并提供完整的Python调用代码示例。
流式响应与思维链分离处理
示例代码演示了如何配置环境变量、流式获取响应,并分别提取思维过程(reasoning_content)与最终答案(content)。
影響分析・編集コメントを表示
影響分析
このリリースは、計算リソースが限られる環境でも高性能なAIモデルを運用可能にするMoEアーキテクチャの実用性を再確認させる。特にコード生成とマルチモーダル能力の向上は、開発者エコシステムの効率化を加速し、オープンソースAI界隈での競争をさらに激化させる要因となる。
編集コメント
モデル名に「3.6」と付くが、MoE設計の最適化とベンチマーク改善に留まり、アーキテクチャ面での画期的な革新はない。ただし、3B活性化で稠密モデルと拮抗するコストパフォーマンスは、実務導入において極めて現実的な選択肢となる。
オリジナル 开源家族+1の 2026-04-16 21:22 浙江
軽量なMoE、実力は健在!
軽量なモデルサイズ、高速な推論。Qwen3.6-35B-A3B がオープンソース化!
これはスパース混合专家(Mixture of Experts, MoE)アーキテクチャを採用した高効率モデルです。総パラメータ数は350億ですが、推論時にアクティブになるのはわずか30億パラメータです。
パラメータ数は少ないものの、パフォーマンスは依然として強力です。エージェントプログラミング(Agent Programming)において、前世代の Qwen3.5-35B-A3B を大幅に上回り、Qwen3.5-27B や Gemma-31B といったより大規模なディープモデル(Dense Model)と肩を並べる性能を発揮します。主な特徴はこちら 👇
モデルの主な特徴まとめ
究極のコスパ:総パラメータ数350億、推論時は30億のみをアクティブ化し、計算コストは極めて低い
強力なプログラミング能力:前世代の Qwen3.5-35B-A3B と比較し、SWE-bench や Terminal-Bench などのベンチマークで大幅に向上
ネイティブマルチモーダル(Native Multimodal):「思考/非思考」のデュアルモードを継承し、画像・テキスト、ドキュメント、空間知能(Spatial Intelligence)などのタスクに対応
完全オープンソース:重みは Hugging Face と ModelScope に公開済みで、ローカルデプロイが可能
プラグアンドプレイ:OpenClaw、Claude Code、Qwen Code などの主流プログラミングアシスタントと互換性あり
アクティブパラメータはわずか30億ながら、Qwen3.6-35B-A3B は複数の主要なプログラミングベンチマークにおいて270億パラメータのディープモデルを上回り、エージェントプログラミングや推論タスクにおいても大幅な向上を実現しています。
コード生成、ターミナル操作、マルチステップタスクの計画などのシナリオにおいて、モデルは安定したタスク実行能力を発揮します。複雑なプロジェクト構造の理解がより深く、ツール呼び出しのチェーンがスムーズになり、マルチターン会話におけるコンテキスト保持能力もより堅牢です。
ネイティブマルチモーダルモデルとして、Qwen3.6-35B-A3B は強力な知覚能力とマルチモーダル推論能力も示しています。
アクティブパラメータは30億のみながら、主要なビジュアルランゲージベンチマーク(Vision-Language Benchmark)の多くにおいて主流のクローズドソースモデル(Closed-source Model)と同等の性能を記録し、一部のタスクでは上回る結果を出しています。特に空間知能におけるモデルの性能が顕著で、RefCOCO では 92.0、ODInW13 では 50.8 を達成し、目標の位置特定と空間関係の理解能力が優れています。
以上の評価結果は Qwen3.6-35B-A3B の実力を示しています。さっそく使い始めるにはどうすればよいでしょうか?
オンライン体験:https://chat.qwen.ai/
ローカルデプロイ
Hugging Face:https://huggingface.co/Qwen/Qwen3.6-35B-A3B
ModelScope:https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B
API呼び出し:https://bailian.console.aliyun.com/
さらに、OpenClaw、Claude Code、Qwen Code などの人気のあるサードパーティ製プログラミングアシスタントにシームレスに統合することも可能です。これにより開発フローを簡素化し、高効率かつコンテキスト認識機能を持つコーディング体験を実現できます。
API 呼び出し
本モデルはすでにAlibaba Cloudの百煉(Bailian)プラットフォームで公開されており、qwen3.6-flash を検索して呼び出すことができます。今回のリリースでは preserve_thinking 機能をサポートしています:これはメッセージ内で過去のすべてのラウンドの思考(推論)内容を保持する機能であり、エージェントタスクへの利用を推奨します。
✅ プロトコルサポート:業界標準プロトコルをサポートしており、OpenAI 仕様に準拠したチャット補完(chat completions)およびレスポンス(responses)API、Anthropic 仕様に準拠した API インターフェースが含まれます。
以下はチャット補完 API のコード例です:
"""
環境変数(公式ドキュメントより):
DASHSCOPE_API_KEY: https://bailian.console.aliyun.com/ から取得した API キー
DASHSCOPE_BASE_URL: (オプション)互換モード API のベース URL。
- 北京:https://dashscope.aliyuncs.com/compatible-mode/v1
- シンガポール:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
- 米国(バージニア):https://dashscope-us.aliyuncs.com/compatible-mode/v1
DASHSCOPE_MODEL: (オプション)モデル名;異なるモデルに上書きする場合。
"""
from openai import OpenAI
import os
api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
raise ValueError(
"DASHSCOPE_API_KEY is required. "
"Set it via: export DASHSCOPE_API_KEY='your-api-key'"
)
client = OpenAI(
api_key=api_key,
base_url=os.environ.get(
"DASHSCOPE_BASE_URL",
"https://dashscope.aliyuncs.com/compatible-mode/v1",
),
)
messages = [{"role": "user", "content": "Introduce vibe coding."}]
model = os.environ.get(
"DASHSCOPE_MODEL",
"qwen3.6-flash",
)
completion = client.chat.completions.create(
model=model,
messages=messages,
extra_body={
"enable_thinking": True,
# "preserve_thinking": True,
},
stream=True
)
reasoning_content = "" # 完全な推論トレース(思考プロセスの全体)
answer_content = "" # 完全な回答
is_answering = False # 回答フェーズに入ったかどうか
print("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")
for chunk in completion:
if not chunk.choices:
print("\nUsage:")
print(chunk.usage)
continue
delta = chunk.choices[0].delta
# 推論コンテンツのみを収集
if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
if not is_answering:
print(delta.reasoning_content, end="", flush=True)
reasoning_content += delta.reasoning_content
# コンテンツを受信し、回答フェーズを開始
if hasattr(delta, "content") and delta.content:
if not is_answering:
print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")
is_answering = True
print(delta.content, end="", flush=True)
answer_content += delta.contentプログラミングアシスタントの統合
Qwen3.6-35B-A3B は優れたエージェントプログラミング(Agent Programming)能力を備えており、OpenClaw、Claude Code、Qwen Code を含む人気のサードパーティ製プログラミングアシスタントとシームレスに統合できます。
OpenClaw
Qwen3.6-35B-A3B は OpenClaw(旧名:Moltbot / Clawdbot)と互換性があります。これはセルフホスティング可能なオープンソースの AI コーディングエージェントです。阿里云百炼(DashScope)に接続することで、ターミナル内で完全なエージェントコーディング体験を得られます。以下のスクリプトで開始してください:
# Node.js 22+
curl -fsSL https://molt.bot/install.sh | bash # macOS / Linux
# Set your API key
export DASHSCOPE_API_KEY=
# Launch OpenClaw
openclaw dashboard # web browser
# openclaw tui # Open a new terminal and start the TUI初回使用時、~/.openclaw/openclaw.json ファイルを編集して OpenClaw を百炼(DashScope)に設定してください。以下のフィールドを見つけて作成し、マージしてください——既存の設定を保持するため、ファイル全体を上書きしないでください:
{
"models": {
"mode": "merge",
"providers": {
"bailian": {
"baseUrl": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"apiKey": "DASHSCOPE_API_KEY",
"api": "openai-completions",
"models": [
{
"id": "qwen3.6-flash",
"name": "qwen3.6-flash",
"reasoning": true,
"input": ["text", "image"],
"contextWindow": 131072,
"maxTokens": 16384
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "bailian/qwen3.6-flash"
},
"models": {
"bailian/qwen3.6-flash": {}
}
}
}
}Qwen Code
Qwen3.6-35B-A3B は Qwen Code と互換性があります。これはターミナル向けに設計されたオープンソースの AI エージェントで、Qwen シリーズに対して深く最適化されています。以下のスクリプトで開始してください:
# Node.js 20+
npm install -g @qwen-code/qwen-code@latest
# Start Qwen Code(interactive)
qwen
# Then, in the session:
/help
/auth初回使用時、システムがログインを促します。いつでも /auth を実行して認証方法を切り替えることができます。
Claude Code
Qwen API は Anthropic API プロトコルもサポートしており、これにより Claude Code などのツールと組み合わせて使用し、より高品質なコーディング体験を得ることができます:
# Install Claude Code
npm install -g @anthropic-ai/claude-code
# Configure environment
export ANTHROPIC_MODEL="qwen3.6-flash"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-flash"
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=
# Launch the CLI
claude活性化パラメータ(Activation Parameters)わずか30億で優れたエージェントプログラミングと推論(Inference)能力を実現する Qwen3.6-35B-A3B は、超低コストの推論において疎性 MoE(Mixture of Experts)モデルが持つ巨大な可能性を実証しました。
今後、Qwen3.6 オープンソースファミリーの拡大を続けてまいります。また、皆様による Qwen3.6-35B-A3B を活用した素晴らしい成果を期待しております。ファミリーの新たなメンバーも間もなく登場いたしますので、どうぞお楽しみに!
おすすめ記事
画像・テキスト・動画を All in One!1つのオープンソースフレームワークで全モーダル知識ベースを構築
FIPO:トークンの2%を正確に追跡し、大規模モデルの推論ボトルネックを突破!
WeChat で開くにはこちらへジャンプ
原文を表示
原创 开源家族+1的 2026-04-16 21:22 浙江
image
轻量 MoE,实力不减!
体量轻巧、推理高效,Qwen3.6-35B-A3B 开源!
这是一款采用稀疏混合专家(MoE)架构的高效模型:总参数 350 亿,每次推理仅激活 30 亿参数。
参数量虽小,性能依旧强劲。在智能体编程上,它大幅超越前代 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B、Gemma-31B 等体量更大的稠密模型一较高下。一起来看亮点 👇
模型亮点速览
极致性价比:35B 总参数,推理时只激活 3B,计算成本极低
编程能力超强:相比前代 Qwen3.5-35B-A3B,在 SWE-bench、Terminal-Bench 等基准上显著提升
原生多模态:延续“思考/非思考”双模式,支持图文、文档、空间智能等任务
完全开源:权重已上架 Hugging Face 和 ModelScope,可本地部署
即插即用:兼容 OpenClaw、Claude Code、Qwen Code 等主流编程助手
仅凭 30 亿激活参数,Qwen3.6-35B-A3B 在多项关键编程基准上超越了 270 亿参数的稠密模型,并在智能体编程和推理任务上大幅提升。
在代码生成、终端操作与多步任务规划等场景中,模型展现出稳定的任务执行力:对复杂项目结构理解更到位,工具调用链路更顺畅,多轮对话中的上下文保持能力也更扎实。
作为原生多模态模型,Qwen3.6-35B-A3B 同样展现出强大的感知和多模态推理能力。
仅用 30 亿激活参数,就在多数视觉语言基准上与主流闭源模型表现相近,部分任务上实现超越。模型在空间智能方面表现尤为突出:在 RefCOCO 上得分92.0,在 ODInW13 上达到 50.8,目标定位与空间关系理解能力在线。
以上评测展示了 Qwen3.6-35B-A3B 的实力,如何快速上手?
在线体验:https://chat.qwen.ai/
本地部署
Hugging Face:https://huggingface.co/Qwen/Qwen3.6-35B-A3B
ModelScope:https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B
API调用:https://bailian.console.aliyun.com/
此外,你也可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code,从而简化开发流程,实现高效且具备上下文感知能力的编码体验。
API 调用
模型已在阿里云百炼上线,你可以搜索qwen3.6-flash 进行调用。本次发布支持preserve_thinking功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。
✅ 协议支持:支持行业标准协议,包括兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。
以下是聊天补全 API 的代码示例:
"""
Environment variables (per official docs):
DASHSCOPE_API_KEY: Your API Key from https://bailian.console.aliyun.com/
DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API.
- Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1
- Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
- US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1
DASHSCOPE_MODEL: (optional) Model name; override for different models.
"""
from openai import OpenAI
import os
api_key = os.environ.get("DASHSCOPE_API_KEY")
ifnot api_key:
raise ValueError(
"DASHSCOPE_API_KEY is required. "
"Set it via: export DASHSCOPE_API_KEY='your-api-key'"
)
client = OpenAI(
api_key=api_key,
base_url=os.environ.get(
"DASHSCOPE_BASE_URL",
"https://dashscope.aliyuncs.com/compatible-mode/v1",
),
)
messages = [{"role": "user", "content": "Introduce vibe coding."}]
model = os.environ.get(
"DASHSCOPE_MODEL",
"qwen3.6-flash",
)
completion = client.chat.completions.create(
model=model,
messages=messages,
extra_body={
"enable_thinking": True,
# "preserve_thinking": True,
},
stream=True
)
reasoning_content = "" # Full reasoning trace
answer_content = "" # Full response
is_answering = False # Whether we have entered the answer phase
print("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")
for chunk in completion:
ifnot chunk.choices:
print("\nUsage:")
print(chunk.usage)
continue
delta = chunk.choices[0].delta
# Collect reasoning content only
if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
ifnot is_answering:
print(delta.reasoning_content, end="", flush=True)
reasoning_content += delta.reasoning_content
# Received content, start answer phase
if hasattr(delta, "content") and delta.content:
ifnot is_answering:
print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")
is_answering = True
print(delta.content, end="", flush=True)
answer_content += delta.content
编程助手集成
Qwen3.6-35B-A3B 具备出色的智能体编程能力,可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code。
OpenClaw
Qwen3.6-35B-A3B 兼容 OpenClaw(原名 Moltbot / Clawdbot),这是一款可自托管的开源 AI 编码智能体。将其连接至阿里云百炼,即可在终端中获得完整的智能体编码体验。请使用以下脚本开始:
Node.js 22+
curl -fsSL https://molt.bot/install.sh | bash # macOS / Linux
Set your API key
export DASHSCOPE_API_KEY=<your_api_key>
Launch OpenClaw
openclaw dashboard # web browser
openclaw tui # Open a new terminal and start the TUI
首次使用时,请编辑~/.openclaw/openclaw.json文件,将 OpenClaw 指向百炼。 找到或创建以下字段并合并它们——切勿覆盖整个文件,以保留您现有的设置:
{
"models": {
"mode": "merge",
"providers": {
"bailian": {
"baseUrl": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"apiKey": "DASHSCOPE_API_KEY",
"api": "openai-completions",
"models": [
{
"id": "qwen3.6-flash",
"name": "qwen3.6-flash",
"reasoning": true,
"input": ["text", "image"],
"contextWindow": 131072,
"maxTokens": 16384
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "bailian/qwen3.6-flash"
},
"models": {
"bailian/qwen3.6-flash": {}
}
}
}
}
Qwen Code
Qwen3.6-35B-A3B 适配 Qwen Code,这是一款专为终端设计的开源 AI 智能体,针对 Qwen 系列进行了深度优化。请使用以下脚本开始:
Node.js 20+
npm install -g @qwen-code/qwen-code@latest
Start Qwen Code(interactive)
qwen
Then, in the session:
/help
/auth
首次使用时,系统会提示您登录。您可以随时运行 /auth 来切换认证方式。
Claude Code
Qwen API 也支持 Anthropic API 协议,这意味着您可以将其与 Claude Code 等工具配合使用,以获得更优质的编码体验:
Install Claude Code
npm install -g @anthropic-ai/claude-code
Configure environment
export ANTHROPIC_MODEL="qwen3.6-flash"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-flash"
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=<your_api_key>
Launch the CLI
claude
仅 30 亿激活参数,就能实现出色的智能体编程与推理能力,Qwen3.6-35B-A3B 证明了稀疏 MoE 模型在极低推理成本下的巨大潜力。
后续,我们将继续扩展 Qwen3.6 开源家族。也期待看到大家用 Qwen3.6-35B-A3B 创造出的精彩成果。更多家族成员即将登场,敬请期待!
推荐阅读
图文视频 All in One!一个开源框架搞定全模态知识库
FIPO:精准追踪2%的Token,突破大模型推理瓶颈!
跳转微信打开
関連記事
アリババの「Qwen 3.7 Max」が Vercel AI Gateway で利用可能に
アリババが開発した大規模言語モデル「Qwen 3.7 Max」が、Vercel の AI ゲートウェイで正式に利用可能となりました。このモデルはコーディングやオフィスワークの自動化など、長期的な自律実行を支援するエージェント基盤として設計されています。
LLM の重み内部における政治的検閲の実態(109 分読)
Qwen3.5-9B モデルの政治的検閲は、読み取り可能で無効化できる小さな回路であり、モデルは事実知識を保持したままそれを迂回するよう学習していることが示された。
Qwen-Scope:知能の解読と可能性の開拓(9 分間読み)
アリババ傘下の通義千問チームは、Qwen3 シリーズ向け解釈性ツールキット「Qwen-Scope」を公開した。このツールはモデル内部メカニズムを可視化し、推論制御や最適化に寄与する。