#multi-agent systems のAIニュース
31件の記事
ツール、メモリ、権限、スキル、マルチエージェント協調を備えた OpenHarness スタイルのエージェントランタイム設計方法
MarkTechPost は、エージェントシステムの実用的な仕組みを理解するため、ツール使用やマルチエージェント協調など主要な構成要素から OpenHarness をゼロから構築するチュートリアルを提供している。
2026 年版生成 AI コーディングツール比較:16 の最良ツールと特徴、最適な用途
MarkTechPost は、ソフトウェア構築を再定義した生成 AI ツールの中から、2026 年に最も優れた 16 のツールを選定し、各機能や開発者への適合性を比較して紹介している。
信頼できる専門 AI を企業が構築する方法(3 分読了)
NVIDIA は、オープンモデルやツールを活用した専用 AI エージェントを構築する「Agent Toolkit」を提供している。Cadence や Synopsys などの企業はこれにより、医療やサイバーセキュリティ分野での業務効率と精度を向上させている。
Claude のエージェントアイデンティティ:自律型チーム全体 AI 向け新アクセスモデル
Anthropic は、自律的な AI エージェントがチーム全体で安全に連携・操作するための新しいアクセス制御モデル「Agent identity」を発表しました。これにより、複数のエージェントが権限を適切に管理しながら協働できるようになります。
Sakana AI、フロントティア LLM を柔軟にルーティングするオーケストレーションモデル「Sakana Fugu」を発表
Sakana AI は、単一のエンドポイントからリクエストを受け付け、タスクの複雑さに応じて直接処理するか複数の専門モデルを協調させるマルチエージェントシステム「Sakana Fugu」を発表した。これは OpenAI 互換 API を提供し、背後で複数の最先端 LLM を動的にルーティングする仕組みである。
サカナ AI のフグ(3 分読了)
サカナ AI ラボが、魚の「フグ」に由来する新しいプロジェクトまたは研究を発表しました。具体的な技術内容や機能の詳細は本文抜粋からは読み取れません。
エージェント間通信プロトコル「A2A」が構築する協調型エージェントの世界
Google Developers AI は、エージェント間通信(A2A)プロトコルの1周年を記念し、従来のAPIの硬直性を排除して自律型AIエージェントが安全に協力・タスク引継ぎを行う仕組みについて紹介した。
マルチエージェントシステムをいつどのように構築するか
LangChain は、複数の AI エージェントが協調して複雑なタスクを解決するマルチエージェントシステムの設計手法と実装タイミングについて解説している。
内側から再構築:AWS プロフェッショナルサービスがフロンティアチームとして歩み始めた理由
AWS プロフェッショナルサービスは、既存プロセスに AI ツールを追加するのではなく、提供方法を根本的に再構築することで、エンゲージメント期間を数ヶ月から数日に短縮した。
消えたクラッシュ:5 つのモデル経済における制御と創発
Hugging Face は、5 つのモデルが共存する経済環境において、システムクラッシュが消失した現象を分析し、制御メカニズムと創発的行動の関係性を明らかにした。
Google Research、Gemini Enterprise Agent Platform にアジェンティック RAG と多段クエリ対応の充分文脈エージェントを追加
Google Research チームは、企業検索の課題である複数ソース・多段クエリへの対応を目的とした新しいアジェンティック RAG 枠組みを Gemini Enterprise Agent Platform に実装し、クロスコーパス検索機能を公開プレビューとして提供開始した。
5 つのラボ、5 つの知性:小型モデルで多モデル金融ドラマを構築する(6 分読)
複数の研究機関が協力し、小型言語モデルを活用して多様な視点を持つ金融ドラマを共同開発した。この取り組みは、リソース制約下での高度な生成技術の可能性を示している。
5 つのラボ、5 つの思考:小規模モデルによるマルチモデル金融ドラマの構築
Hugging Face は、5 つの研究機関が協力し、小規模な AI モデルを活用して複数の視点を持つ金融ドラマを生成する手法を発表した。
Rippling が Deep Agents と LangSmith を活用し、6 ヶ月で本番環境の AI を構築した方法
企業人事管理プラットフォーム「Rippling」は、Deep Agents および LangSmith というツールを用いて、わずか 6 ヶ月の短期間で本番運用可能な AI システムを構築・導入することに成功しました。
Pi の拡張機能「pi-dynamic-workflows」:Claude-Code スタイルの動的ワークフローを実現
Pi の開発者が提供する拡張機能「pi-dynamic-workflows」は、単一のアシスタントが順次処理するのではなく、モデルが JavaScript スクリプトを記述して多数の独立したサブエージェントに作業を分散させ、結果を統合する動的ワークフロー機能を追加します。
動的ワークフローの紹介(3 分読了)
Jarred Sumner は動的ワークフローを活用し、Bun を Zig から Rust に書き換え、11 日間で 75 万行のコードを処理してテストスイートの成功率 99.8% を達成した。この手法では Claude がタスクを細分化し、エージェントが並列実行して結果が収束するまで動作する。
マルチエージェント・ワールドモデル(3 分で読める)
TLDR AI が、複数のエージェントが協調して環境をシミュレーションする「マルチエージェント・ワールドモデル」に関する解説記事を公開しました。
Claude の新モデルは失敗時に「正直」になる
Anthropic は木曜日に Claude Opus 4.8 をリリースし、同モデルの「誠実さ」を強調している。同社はすべてのモデルを、根拠のない主張を避けるよう訓練しており、AI モデルが結論を飛び越える一般的な問題を解決するとしている。
LangGraph と LangSmith を活用した Lyft のセルフサービス AI エージェントプラットフォーム構築事例
ライドシェア企業の Lyft が、LangChain の LangGraph と LangSmith を利用し、開発者が独自に AI エージェントを構築・管理できるセルフサービスプラットフォームを構築した手法について紹介している。
Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCore を用いた高性能生成 AI システムの構築
AWS は、Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCore を組み合わせることで、高速推論と複数エージェントの調整を可能にし、生産環境で信頼性の高い高性能な生成 AI エージェントを構築する方法を発表した。
Amazon Nova Sonic を用いたスケーラブルな音声エージェント設計:マルチエージェント、ツール連携、セッション分割
AWS は、遅延やリアルタイム音声管理などの課題に対処するため、Amazon Nova Sonic を活用したスケーラブルな音声エージェントの設計パターンを公開し、複数のエージェント協調やセッション分割手法を紹介した。
マイクロソフトのマルチエージェントAIシステムがサイバーセキュリティベンチマークでアンソロピックのMythosを上回る
マイクロソフトは、100以上の専門AIエージェントを連携させる「MDASH」システムを開発し、コードスキャンから検証、攻撃証明までを行うことで、アンソロピックの「Mythos」モデルを上回る成果をサイバーセキュリティベンチマークで達成した。
Vercel 上で AI エージェント向け IDE を構築した Superset の取り組み
Superset は Vercel 上で、従来の開発ツールでは対応できない大規模な AI エージェント運用を可能にする統合開発環境(IDE)を構築しました。同社は週に最大 1,400 件のデプロイや、平均 30 秒のビルド時間を実現し、日次プレビューデプロイも約 600 件処理しています。
エージェント型自動化のスケーラビリティ実現へ
WorkHQは、断片化したシステム間での通信不全を解消し、AIエージェントと人間が連携する本格的な業務自動化の実現を目指す。既存の自動化レイヤーを統合し、スケーラブルなマルチエージェントワークフローの実用化を約束する。
アジェンティック・エンジニアリング:AIエージェントの群れがソフトウェアエンジニアリングを再定義する方法
LangGraphに基づくマルチエージェントシステムは、実際のエンジニアリングチームを模倣し、デバッグ時間を93%削減し、クロスチームの納期を圧縮する。
EinsteinArena:野生のエージェント集団知能を活用して科学を進展させる
EinsteinArenaは、AIエージェントが数学問題で協力・競争するプラットフォーム。同プラットフォームのエージェントは11件の新記録を樹立し、次元11の kissing number の下限を593から604に引き上げた。
HiMAP-Travel: 長期間制約付き旅行のための階層型マルチエージェント計画
研究チームは、予算や多様性要件などの厳しい制約がある長期間計画において逐次LLMエージェントが失敗する問題を解決するため、階層型マルチエージェントフレームワーク「HiMAP-Travel」を提案した。このフレームワークは、戦略的調整と並列的な日次実行に計画を分割し、コーディネーターが日々のリソースを割り当て、日次実行者が並列で独立して計画を実行する。
Deep Agentsを使用したマルチエージェントアプリケーションの構築
LangChain社のSydney RunkleとVivek Trivedyが、複雑なタスクを専門エージェントに分割するDeep Agentsフレームワークを紹介。サブエージェントとスキルという2つの基本概念でマルチエージェントシステム構築を容易にする。
AssetOpsBench:AIエージェントベンチマークと産業現場のギャップを埋める
研究者らが、AIエージェントの評価基準と産業現場の実態を結び付ける「AssetOpsBench」を発表した。このベンチマークは、現実の産業環境でのAIエージェントの性能評価を目的としている。
長期間自律的なコーディングのスケーリング
研究チームが、数週間にわたって自律的に動作するコーディングエージェントの実験を実施し、長期間の自律コーディングの実現可能性を探っている。
Google DeepMind、米国エネルギー省とGenesisプロジェクトで連携:イノベーションと科学的発見を加速する国家的ミッション
Google DeepMindと米国エネルギー省が、AIで科学を加速する新プロジェクト「Genesis」で連携する。