#言語モデル のAIニュース
14件の記事
MIT と IBM が AI および量子コンピューティング研究ラボを設立
MIT スチャーズマン計算科学科と IBM は、古典的なシステムの限界を超える新たな計算手法を開発するため、AI 基礎研究に加え量子コンピューティングも対象とした共同研究ラボ「MIT-IBM Computing Research Lab」の設立を発表した。
研究者が発見:AIモデルは助けを求めるより推測することを選ぶ
研究者がProactiveBenchで22のマルチモーダル言語モデルをテストした結果、視覚情報が欠けている場合に助けを求めるモデルはほぼなく、単純な強化学習アプローチが修正の可能性を示唆している。
LLMはコーディングと数学で圧倒的だが日常質問でつまずく、それは矛盾ではない
AIモデルはコードベース全体を数時間で再構築できるが、単純な日常質問でつまずく。これは矛盾ではなく、現在の言語モデルの根本的限界を示している可能性がある。
Spotifyの2025年Wrappedアーカイブの内側:大規模なAIナラティブとプライバシーのトレードオフ
Spotifyのエンジニアリングチームが、3億5000万人のユーザー向けに14億件のパーソナライズされたレポートを生成した「Wrapped Archive」を開発した。このシステムは、言語モデルを使用して主要な聴取日を特定し、ナラティブを作成している。企業がナラティブ要約を提供するにつれ、ユーザーのプライバシーとデータ追跡に関する懸念が残り、洞察とプライバシーのバランスが求められている。
未来を見据える思考:トランスフォーマーの潜在先読みトレーニング
OpenAIの研究者が、従来の次トークン予測に代わる潜在先読みトレーニングを提案。この手法は、トランスフォーマーモデルが複数の可能性を探索・反映できるようにし、計算リソースを柔軟に配分することで、生成品質と推論能力の向上を目指す。
混合から専門領域への言語モデルの最適分割
研究チームが、言語モデルの事前学習後に専門データで特殊化する標準手法を、複数領域設定で最適に分割する方法を提案した。ICLR 2026ワークショップで採択された。
クアルコム、スマートフォン向け思考モデルのAI推論チェーンを2.4倍圧縮
クアルコムAIリサーチが、スマートフォン上で推論可能な言語モデルを実現するモジュラーシステムを開発し、モデルの冗長な思考プロセスを2.4倍圧縮した。
OpenAI、16MB「パラメータゴルフ」チャレンジでモデル圧縮を人材発掘に転換
OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。
AIエージェントキャッチアップ #69 - 再帰的言語モデル(RLMs)を開催
ジェネラティブエージェンツの大嶋が「AIエージェントキャッチアップ #69」勉強会を開催し、言語モデルが入力を分解して自身を再帰的に呼び出す「再帰的言語モデル(RLMs)」について議論した。
直感的な検索を目指して(『ベクトル検索実践入門』を執筆しました)
LINEヤフーの検索エンジン開発担当者が、ベクトル検索技術について解説し、同社での検索・広告配信・レコメンドへの応用事例を紹介した。
GPT-5.3 インスタントシステムカード
OpenAIがGPT-5.3のシステムカードを公開し、モデルの性能・安全性・制限事項を即時開示した。
Llama 3はあまり検閲されていない
Metaが公開したLlama 3は、Llama 2と比較して大幅に検閲が緩和され、誤った拒否率が低下し、以前に拒否されたプロンプトの3分の1未満しか拒否しない。
製品向けオンデバイス言語モデルのためのプライベートトレーニングの進展
Googleの研究者が、オンデバイス言語モデルのプライベートトレーニング技術を向上させ、ユーザーデータのプライバシーを保護しながら効率的な学習を実現した。
Mistralモデルへのllama-adapterファインチューニング
Spiral.AI株式会社のエンジニアが、Mistral AIが2023年9月にリリースした言語モデル「Mistralモデル」にllama-adapterを適用してファインチューニングする方法を紹介している。