#推論のAIニュース

20件の記事

CUGA を用いた本格的なエージェントアプリ構築：軽量ハーンス上の24の動作例

IBM が公開したオープンソースの「CUGA」は、計画・実行・状態管理の複雑さを処理し、開発者がツール選択とプロンプト設計に集中できるようにするエージェント用ハーンスです。このシステムは効率的な状態維持とエラー修正機能を持ち、AppWorld などのベンチマークで他社を上回る性能を示しています。

TLDR AI·6月24日·★★★★

Claude Corps の紹介

Anthropic が、複数の Claude モデルを統合・連携させる新機能「Claude Corps」を発表した。これにより、複雑なタスク処理や大規模な推論がより効率的に行えるようになる。

Anthropic News·6月11日

VAKRAの内部：エージェントの推論、ツール使用、失敗モード

OpenAIがVAKRAエージェントの推論能力、ツール使用、失敗モードを分析し、AIエージェントの信頼性向上に向けた課題を明らかにした。

Hugging Face Blog·4月15日·★★★★

Amazon SageMaker HyperPodで推論を実行するためのベストプラクティス

Amazon SageMaker HyperPodは、生成AI推論のための基盤モデルをデプロイ・スケーリングする際の課題（インフラ構築の複雑さ、予測不能なトラフィック、GPUリソース管理の負荷）に対処するベストプラクティスを提供する。

AWS Machine Learning Blog·4月15日

IstioがAI時代に向け進化：マルチクラスタ、アンビエントモード、推論機能を導入

Cloud Native Computing Foundation（CNCF）が、AI駆動ワークロードに対応するため、Istioにマルチクラスタ、アンビエントモード、推論機能を追加し、サービスメッシュを進化させた。

InfoQ·4月7日·★★★★

FIPO：2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破！

通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。

通义大模型·4月7日·★★★★

Nvidiaが288GPUでMLPerf新記録を樹立、AMDとIntelは異なる戦いに注力

Nvidiaは288基のGPUでMLPerfベンチマークの新記録を達成した。一方、AMDとIntelは異なる評価指標を重視しており、直接比較は困難である。最新のMLPerfでは初めてマルチモーダルモデルと動画モデルが導入された。

The Decoder·4月2日

韓国のAIチップメーカーが推論用に4億ドルを調達

韓国のAIチップメーカーRebellionsが、AI推論市場向けに4億ドルを調達した。同社はシリコンの多様性を提供する新規参入企業として市場機会を狙っている。

AI Business·4月1日

未来を見据える思考：トランスフォーマーの潜在先読みトレーニング

OpenAIの研究者が、従来の次トークン予測に代わる潜在先読みトレーニングを提案。この手法は、トランスフォーマーモデルが複数の可能性を探索・反映できるようにし、計算リソースを柔軟に配分することで、生成品質と推論能力の向上を目指す。

Apple Machine Learning·3月25日·★★★★

NVIDIA Nemotron 3エージェントの構築：推論、マルチモーダルRAG、音声、安全性

NVIDIAが、計画・推論・検索・安全制御を専門モデルが連携して処理するエージェントAIシステム「Nemotron 3」を開発した。

NVIDIA Developer Blog·3月25日·★★★★

ゴルディロックスRL：推論のためのスパース報酬から脱却するためのタスク難易度調整

研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。

Apple Machine Learning·3月18日·★★★★

Mistral Small 4の紹介

Mistralが、推論モデルMagistral、マルチモーダルモデルPixtral、エージェントコーディングモデルDevstralの機能を統合した119Bパラメータの新モデル「Mistral Small 4」をApache 2ライセンスでリリースした。

Simon Willison Blog·3月17日·★★★★

意味的類似性を超えて：NVIDIA NeMo Retrieverの汎用化可能なエージェント型検索パイプラインの紹介

NVIDIAが、従来の意味的類似性検索を超える汎用化可能なエージェント型検索パイプライン「NeMo Retriever」を発表した。

Hugging Face Blog·3月14日·★★★★

多言語推論ジム：手続き的推論環境の多言語スケーリング

研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。

Apple Machine Learning·3月13日·★★★★

Nemotron 3 Superの紹介：エージェント推論のためのオープンなハイブリッドMamba-Transformer MoE

NVIDIAが、エージェントAIシステム向けに推論・コーディング・長文脈処理に特化したオープンソースのハイブリッドMamba-Transformer MoEモデル「Nemotron 3 Super」を発表した。

NVIDIA Developer Blog·3月12日·★★★★

GPT-5.4がWindsurfで利用可能に

WindsurfがGPT-5.4を複数の推論努力レベルで提供開始し、期間限定でセルフサービスユーザー向けに1倍クレジットからのプロモーション価格を設定した。

Windsurf Blog·3月5日

AAAI-2026 参加報告：サイバーエージェント村田氏がシンガポールで開催された人工知能国際会議に参加し、採択論文を発表

サイバーエージェントの AI チーム所属・村田氏は、1 月 20 日から 27 日にシンガポールで開催された人工知能研究の国際会議「AAAI-2026」に参加しました。同氏は学生時代から継続していた論文が採択され、過去最多の投稿数があった本会議で研究成果を発表しました。

AI Shift Tech Blog·2月6日

AI週報 #330 - Groq→Nvidia、ChatGPTアプリ、米国AI創世ミッション

NvidiaがAIチップスタートアップのGroqの資産を約200億ドルで買収し、同社最大の取引となった。

Last Week in AI·12月25日·★★★★★

スクラッチからの推論入門：第1章

著者がLLMにおける推論の仕組みについての新著を執筆中であり、購読者向けに第1章を公開した。本章ではLLMの推論の基本概念と推論時サンプリングなどの手法を概説している。

Sebastian Raschka·3月29日

チェーン・オブ・テーブル：表理解のための推論チェーンにおける表の進化

Google Cloud AIチームの研究者が、表データを段階的に拡張・推論する「チェーン・オブ・テーブル」手法を発表した。この手法は表理解タスクの精度向上を目指すもので、AIによるデータ分析能力の進展を示している。

Google Research Blog·3月12日·★★★★

#推論 のAIニュース