#効率化 のAIニュース
11件の記事
FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!
通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。
Googleが新AIメモリ圧縮アルゴリズム「TurboQuant」を発表、ネットでは「Pied Piper」と話題に
GoogleがAIの作業メモリを最大6倍圧縮する新アルゴリズム「TurboQuant」を発表したが、現時点では実験段階である。
OpenAI、16MB「パラメータゴルフ」チャレンジでモデル圧縮を人材発掘に転換
OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。
DeNA × AI Day 2026 イベントレポート ── 内定者が見たAIオールインの現在地
DeNAが2026年3月6日に「DeNA × AI Day 2026 Proof.」を開催し、AIオールイン宣言から1年後の成果を3ステージ構成で発表した。
TrajTok:軌跡トークンの学習により動画理解が向上
研究者らが、動画モデルの効率と拡張性を向上させるため、外部パイプラインに依存しない統合型トークナイザー「TrajTok」を提案した。
Perplexity、GoogleやAlibabaに匹敵する埋め込みモデルをメモリコスト大幅削減でオープンソース化
AI検索エンジンのPerplexityは、GoogleやAlibabaのモデルに匹敵する性能を通常のメモリコストの一部で実現する2つの新しいテキスト埋め込みモデルをオープンソースとして公開した。
研究が示す、推論モデルが解決策を超えて考えがちな理由
AI推論モデルは、最適な停止点を過ぎても推論を続ける傾向があり、効率性と過剰思考のバランスが課題となっています。
AI活用を安定させる型「Diff-in / Merge-out」〜翻訳タスクで学ぶ責務の分離〜
LayerXのエンジニアyoheiが、AI開発ツールの進化を受け、翻訳タスクにおける責務分離の型「Diff-in / Merge-out」を提案し、AI活用の安定化を目指す。
オン・ポリシー蒸留
ケビン・ルーらによる、思考機械におけるオン・ポリシー蒸留の研究についての記事。
Google Gemma 2のリリース
Googleがパラメータ数20億、90億、270億の3種類のGemma 2を発表。270億パラメータで、その2倍以上の規模のモデルを上回る性能を実現。Ollamaで簡単に実行可能。
図解リトリーバルトランスフォーマー
最新の言語モデルは、データベースやウェブ検索を活用することで小型化しつつGPT-3並みの性能を実現。リトリーバルトランスフォーマーが鍵となる技術。