#モデル最適化 のAIニュース
17件の記事
ハルネスへの過学習のコスト(2 分読了)
大手 AI ラボが特定のユースケースにモデルを最適化し、ハルネス設計を学習させることで汎用性が低下している。これにより一部企業のアプリケーション構築は容易になるが、ベンダーロックインという代償が生じる。
中国のAI研究所からの報告
著者は杭州から上海へ向かう新幹線内で風力タービンの風景を眺め、中国での訪問を終えた。そこで多くのAI関係者と交流し、異文化への敬意と温かい歓迎体験を通じて謙虚な気持ちになったと述べている。
SpecMD:予測的専門家プリフェッチングに関する包括的研究
研究者らは、Mixture-of-Experts モデルの性能向上に不可欠な専門家のキャッシュ機構について、既存のハードウェア中心の方策との相互作用を解明するため、標準化された研究手法「SpecMD」を開発した。
MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張
MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。
FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!
通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。
AIエージェントの継続的学習
LangChain社が、AIエージェントの継続的学習はモデル層だけでなく、ハーネス層とコンテキスト層の3層で行われると指摘し、時間とともに進化するシステム構築の考え方を変えると述べた。
TRL v1.0:分野の前提が崩れても機能するポストトレーニングライブラリ
Hugging Faceが、AIモデルのポストトレーニング用ライブラリ「TRL v1.0」をリリースした。このライブラリは、研究分野の前提が変化しても柔軟に対応できる設計となっている。
効率的なファインチューニングのためのLoRAターゲットモジュール選択の最適化
研究者のRushil AnirudhとAnjie Fangが、低ランク適応(LoRA)を使用してAIモデルをファインチューニングする際の精度と効率性のトレードオフを明らかにするアブレーション研究を実施した。
GPT-5.4 miniおよびnano、7万6000枚の写真記述を52ドルで実現
OpenAIがGPT-5.4 miniとnanoを発表。新モデルは従来モデルより高性能で高速。価格はGPT-5.4-miniが入力100万トークンあたり0.15ドル、出力100万トークンあたり0.60ドル。
GPT 5.4 MiniとNanoがAI Gatewayで利用可能に
OpenAIがGPT-5.4 MiniとGPT-5.4 NanoをVercel AI Gatewayで公開した。これらのモデルは、複数の小規模モデルが大規模タスクを協調するサブエージェントワークフロー向けに設計され、応答詳細度や推論レベルの制御が可能である。
GPT-5.4 miniおよびnanoの紹介
OpenAIがGPT-5.4の小型高速版「mini」と「nano」を発表。コーディング、ツール使用、マルチモーダル推論、大量API処理向けに最適化されている。
TrajTok:軌跡トークンの学習により動画理解が向上
研究者らが、動画モデルの効率と拡張性を向上させるため、外部パイプラインに依存しない統合型トークナイザー「TrajTok」を提案した。
Gemini 3.1 Flash-Liteが入力処理方法の選択肢を提供
クラウドプロバイダーが新モデルGemini 3.1 Flash-Liteを発表し、企業開発者が直面する課題に対応するため、タスクに応じた思考レベルを提供する。
Differential Transformer V2が発表されたので、今更ながらV1論文を読んで差分を確認してみた
Differential Transformer V2は、V1の2つのアテンションの差分を取るシンプルなアイデアを発展させ、アテンションノイズ抑制やスケーリング効率向上などの改善を実現した。
Claude Opus 4.5がトークンを節約、ホワイトハウスがAI駆動科学を推進、AmazonがNova 2 Proチェックポイントを公開、小型モデルが難解パズルを解決
AnthropicがClaude Opus 4.5のトークン節約機能を発表し、ホワイトハウスがAI駆動科学研究を推進する政策を発表した。AmazonはNova 2 Proチェックポイントを公開し、小型AIモデルが複雑なパズル解決に成功した。
CursorのエージェントをOpenAI Codexモデル向けに改善
Cursor社が、GPT-5.1-Codex-Maxをサポートするためにエージェントハーネスを更新した。
Stability AIとArmがスマートフォン向けオンデバイス生成音声を実現
Stability AIとArmは、Arm KleidiAIライブラリとStable Audio Open技術を活用し、インターネット接続不要でスマートフォン上で高品質な音声生成を可能にした。処理速度は30倍向上し、生成時間が数分から数秒に短縮される。2025年3月3日のMWCバルセロナで発表予定。