#効率化のAIニュース

11件の記事

FIPO：2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破！

通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。

GoogleがAIの作業メモリを最大6倍圧縮する新アルゴリズム「TurboQuant」を発表したが、現時点では実験段階である。

OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。

DeNAが2026年3月6日に「DeNA × AI Day 2026 Proof.」を開催し、AIオールイン宣言から1年後の成果を3ステージ構成で発表した。

研究者らが、動画モデルの効率と拡張性を向上させるため、外部パイプラインに依存しない統合型トークナイザー「TrajTok」を提案した。

AI検索エンジンのPerplexityは、GoogleやAlibabaのモデルに匹敵する性能を通常のメモリコストの一部で実現する2つの新しいテキスト埋め込みモデルをオープンソースとして公開した。

AI推論モデルは、最適な停止点を過ぎても推論を続ける傾向があり、効率性と過剰思考のバランスが課題となっています。

LayerXのエンジニアyoheiが、AI開発ツールの進化を受け、翻訳タスクにおける責務分離の型「Diff-in / Merge-out」を提案し、AI活用の安定化を目指す。

ケビン・ルーらによる、思考機械におけるオン・ポリシー蒸留の研究についての記事。

Googleがパラメータ数20億、90億、270億の3種類のGemma 2を発表。270億パラメータで、その2倍以上の規模のモデルを上回る性能を実現。Ollamaで簡単に実行可能。

最新の言語モデルは、データベースやウェブ検索を活用することで小型化しつつGPT-3並みの性能を実現。リトリーバルトランスフォーマーが鍵となる技術。