#moeアーキテクチャ のAIニュース
4件の記事
Qwen3.6-35B-A3Bがオープンソース化!
Qwenチームが、総パラメータ350億の軽量MoE(混合エキスパート)モデル「Qwen3.6-35B-A3B」をオープンソースで公開した。推論時に活性化するパラメータは30億と少ないが、前世代モデルを性能で上回り、大規模な密モデルと同等の性能を発揮する。
通义大模型·4月16日
LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals
Andrey KurenkovとJeremie Harrisが、OpenAIが40万トークンのコンテキストウィンドウを持つGPT-5.4 miniとnanoを発表したことなど、先週の主要なAIニュースを要約・議論した。
Last Week in AI·4月1日·★★★★
マルチエージェントAIの経済性がビジネス自動化に与える影響
企業がマルチエージェントAIを導入する際、「思考コスト」と「文脈爆発」という2つの課題に直面する。これらの経済的制約が、現代のビジネス自動化ワークフローの実現可能性を左右している。
AI News·3月13日·★★★★
NVIDIAの極端なハードウェア・ソフトウェア協調設計がSarvam AIの主権モデルに大規模な推論向上をもたらした方法
NVIDIAのハードウェアとソフトウェアの協調設計により、Sarvam AIの主権AIモデルの推論性能が大幅に向上した。
NVIDIA Developer Blog·2月19日·★★★★