#推論 のAIニュース
20件の記事
CUGA を用いた本格的なエージェントアプリ構築:軽量ハーンス上の24の動作例
IBM が公開したオープンソースの「CUGA」は、計画・実行・状態管理の複雑さを処理し、開発者がツール選択とプロンプト設計に集中できるようにするエージェント用ハーンスです。このシステムは効率的な状態維持とエラー修正機能を持ち、AppWorld などのベンチマークで他社を上回る性能を示しています。
Claude Corps の紹介
Anthropic が、複数の Claude モデルを統合・連携させる新機能「Claude Corps」を発表した。これにより、複雑なタスク処理や大規模な推論がより効率的に行えるようになる。
VAKRAの内部:エージェントの推論、ツール使用、失敗モード
OpenAIがVAKRAエージェントの推論能力、ツール使用、失敗モードを分析し、AIエージェントの信頼性向上に向けた課題を明らかにした。
Amazon SageMaker HyperPodで推論を実行するためのベストプラクティス
Amazon SageMaker HyperPodは、生成AI推論のための基盤モデルをデプロイ・スケーリングする際の課題(インフラ構築の複雑さ、予測不能なトラフィック、GPUリソース管理の負荷)に対処するベストプラクティスを提供する。
IstioがAI時代に向け進化:マルチクラスタ、アンビエントモード、推論機能を導入
Cloud Native Computing Foundation(CNCF)が、AI駆動ワークロードに対応するため、Istioにマルチクラスタ、アンビエントモード、推論機能を追加し、サービスメッシュを進化させた。
FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!
通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。
Nvidiaが288GPUでMLPerf新記録を樹立、AMDとIntelは異なる戦いに注力
Nvidiaは288基のGPUでMLPerfベンチマークの新記録を達成した。一方、AMDとIntelは異なる評価指標を重視しており、直接比較は困難である。最新のMLPerfでは初めてマルチモーダルモデルと動画モデルが導入された。
韓国のAIチップメーカーが推論用に4億ドルを調達
韓国のAIチップメーカーRebellionsが、AI推論市場向けに4億ドルを調達した。同社はシリコンの多様性を提供する新規参入企業として市場機会を狙っている。
未来を見据える思考:トランスフォーマーの潜在先読みトレーニング
OpenAIの研究者が、従来の次トークン予測に代わる潜在先読みトレーニングを提案。この手法は、トランスフォーマーモデルが複数の可能性を探索・反映できるようにし、計算リソースを柔軟に配分することで、生成品質と推論能力の向上を目指す。
NVIDIA Nemotron 3エージェントの構築:推論、マルチモーダルRAG、音声、安全性
NVIDIAが、計画・推論・検索・安全制御を専門モデルが連携して処理するエージェントAIシステム「Nemotron 3」を開発した。
ゴルディロックスRL:推論のためのスパース報酬から脱却するためのタスク難易度調整
研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。
Mistral Small 4の紹介
Mistralが、推論モデルMagistral、マルチモーダルモデルPixtral、エージェントコーディングモデルDevstralの機能を統合した119Bパラメータの新モデル「Mistral Small 4」をApache 2ライセンスでリリースした。
意味的類似性を超えて:NVIDIA NeMo Retrieverの汎用化可能なエージェント型検索パイプラインの紹介
NVIDIAが、従来の意味的類似性検索を超える汎用化可能なエージェント型検索パイプライン「NeMo Retriever」を発表した。
多言語推論ジム:手続き的推論環境の多言語スケーリング
研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。
Nemotron 3 Superの紹介:エージェント推論のためのオープンなハイブリッドMamba-Transformer MoE
NVIDIAが、エージェントAIシステム向けに推論・コーディング・長文脈処理に特化したオープンソースのハイブリッドMamba-Transformer MoEモデル「Nemotron 3 Super」を発表した。
GPT-5.4がWindsurfで利用可能に
WindsurfがGPT-5.4を複数の推論努力レベルで提供開始し、期間限定でセルフサービスユーザー向けに1倍クレジットからのプロモーション価格を設定した。
AAAI-2026 参加報告:サイバーエージェント村田氏がシンガポールで開催された人工知能国際会議に参加し、採択論文を発表
サイバーエージェントの AI チーム所属・村田氏は、1 月 20 日から 27 日にシンガポールで開催された人工知能研究の国際会議「AAAI-2026」に参加しました。同氏は学生時代から継続していた論文が採択され、過去最多の投稿数があった本会議で研究成果を発表しました。
AI週報 #330 - Groq→Nvidia、ChatGPTアプリ、米国AI創世ミッション
NvidiaがAIチップスタートアップのGroqの資産を約200億ドルで買収し、同社最大の取引となった。
スクラッチからの推論入門:第1章
著者がLLMにおける推論の仕組みについての新著を執筆中であり、購読者向けに第1章を公開した。本章ではLLMの推論の基本概念と推論時サンプリングなどの手法を概説している。
チェーン・オブ・テーブル:表理解のための推論チェーンにおける表の進化
Google Cloud AIチームの研究者が、表データを段階的に拡張・推論する「チェーン・オブ・テーブル」手法を発表した。この手法は表理解タスクの精度向上を目指すもので、AIによるデータ分析能力の進展を示している。