#model efficiency のAIニュース

5件の記事

リプレイバッファを用いた難問の再検討(8 分読了)

研究者がリプレイバッファという手法を再評価し、AI モデルの学習効率や複雑な問題解決能力を向上させる可能性について議論している。

TLDR AI·6月19日

再帰型言語モデルの強化:強化学習による効率的な実装

研究者らは、4B パラメータのモデルに強化学習を適用し、親と子の両方の再帰型言語モデル(RLM)で共有ポリシーを訓練する手法を開発しました。これにより、Claude Sonnet 4.6 と同等のパフォーマンスを維持しつつ、モデルサイズとコストを大幅に削減することに成功しています。

TLDR AI·5月13日·★★★★

EMO:データからモジュール型専門家が自然発生的に出現する事前学習混合専門家モデル

Google が「EMO」と呼ぶ新しい混合専門家モデルを開発し、データからタスク固有の専門家グループが自律的に形成される仕組みを実現した。これにより、ユーザーは全モデル性能を維持しつつ、小規模な専門サブセットを選択して利用できるようになる。

Allen AI (AI2)·5月8日·★★★★

Parcae:安定したループモデルで少ないパラメータでより多くのことを実現

Parcaeは、Transformerの2倍のサイズに匹敵する品質を持つ安定したループ言語モデルです。7.7億パラメータのモデルが13億レベルのパフォーマンスを実現し、ループ回数の増加が計算効率の高いスケーリング法則であることを示しました。

Together AI Blog·4月15日·★★★★

Cappy: 小さなスコアラーで大規模マルチタスク言語モデルを凌駕・強化

Googleが開発した小規模スコアラー「Cappy」が、大規模言語モデルの性能向上と効率化を実現する手法を紹介。

Google Research Blog·3月15日·★★★★