#autonomous agents のAIニュース
46件の記事
アジェンティック AI に関する一般的な誤解とは何か
KDnuggets は、アジェンティック AI の本質や運用における多くの人が抱いている誤った認識について解説している。
Cisco AI、FAPO(パイプライン対応プロンプト最適化)を発表:ステップごとの失敗特定とClaude Codeによるオーケストレーションを実現
Cisco AIは、LLMアプリケーションの信頼性向上を目的とした「FAPO」というシステムを導入した。これはClaude Codeを活用し、多段階パイプラインにおける各ステップの失敗箇所を特定しながらプロンプトを自動最適化する技術である。
エージェント間通信プロトコル「A2A」が構築する協調型エージェントの世界
Google Developers AI は、エージェント間通信(A2A)プロトコルの1周年を記念し、従来のAPIの硬直性を排除して自律型AIエージェントが安全に協力・タスク引継ぎを行う仕組みについて紹介した。
AI コーディングエージェントがロボットに GPU 取り付けやジップタイ切断を教示
Ars Technica は、計算リソースとトークン予算を与えられた AI コーディングエージェントが、自律的にロボットアームの訓練プログラムを策定し、GPU の挿入やジップタイの切断といった物理作業を習得した事例を紹介している。
Hugging Face Hub からロボットハードウェアへ:Strands Agents と LeRobot の連携
Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。
エージェント型リソース発見:エージェントが検索できるようにする
Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。
LangChain Blog: Monte Carlo、LangGraph と LangSmith を活用したデータおよび AI 観測エージェントの構築
Monte Carlo は、LangGraph と LangSmith を組み合わせて、データの品質と AI の挙動を監視・分析する自律型エージェントの開発手法を発表しました。
Microsoft Research、LOTUSLITE の新たな変種を Ire が特定
マイクロソフト研究所の AI エージェント「Ire」が、公知の LOTUSLITE と戦術は共有するが検出指標を持たない新変種を特定し、ユーザー操作なしで機能ごとの振る舞いレポートを作成した。
エージェント向け Coinbase:AI を活用したポートフォリオ取引の自動化
Coinbase が提供する「Coinbase for Agents」は、大規模言語モデルに金融実行チャネルを接続し、ユーザーのポートフォリオから直接取引や決済を自動実行可能にする機能を提供する。
エージェント型インターフェースの進化:Claude Managed Agents を活用した構築(13 分読了)
TLDR AI は、Claude Managed Agents を用いてエージェント型インターフェースをどのように構築し進化させるかについて解説している。
Anthropic の Fable 5 はワンクリックで奇妙に面白いビデオゲームを生成可能
AI 企業 Anthropic が発表した「Fable 5」は、ユーザーがボタンを1回押すだけで、独自の世界観を持つ面白おかしいビデオゲームを自動生成する機能を備えている。
Notion で Codex が可能にする機能とは
OpenAI は、自社の AI コード生成モデル「Codex」が Notion の利用体験をどのように拡張し、ユーザーに新たな価値をもたらすかを解説した。
DevOps における自律型 AI のデータ損失:効率的な防御の構築
ソフトウェア開発を加速させる自律型 AI エージェントが、ミスを大惨事に変える速度を縮め、セキュリティ戦略に危険な盲点を生み出している。内部ツールの誤作動による被害拡大が懸念されている。
Anthropic、新生産コードの80%がClaudeによって作成されたと発表—企業も追いつく方法とは(7分読了)
Anthropicは、自社の生成AIモデル「Claude」が現在、新規に作成される生産用コードの80%を担っていると発表した。同社は、他社を含む企業がどのようにしてこの技術導入を加速し、競争力を高めるべきかについて具体的な戦略を示している。
コード参照ハッチの防御(GitHub リポジトリ)
Anthropic は、Claude を用いた自律的な脆弱性発見と修正のためのリファレンス実装を GitHub に公開し、一般ベストプラクティスに基づくカスタムパイプライン構築を可能にした。
マイクロソフトの「Scout」は M365 を横断するエージェント型オートパイロット
マイクロソフトは、ビルドイベントで新機能「Autopilot(オートパイロット)」のテスト範囲を拡大したと発表した。これはユーザーに代わって自律的に動作し、複数のエージェントが異なるルールセット内で共存できる新しいカテゴリのエージェントである。
モルガン・スタンレーがまもなく AI エージェントに 1 兆ドル規模の資産運用パイプラインを開放
モルガン・スタンレーは、今後 AI エージェントに対して 1 兆ドル規模の資産管理業務へのアクセスを開始する方針を示した。
トラベラーズが OpenAI を活用した AI 駆動型請求処理を全国展開
保険大手のトラベラーズは、OpenAI の技術を活用した AI による請求処理システムを米国全土で導入し、業務効率化と顧客対応の迅速化を実現しました。
Claude Code における全タスク対応のハッチ:動的ワークフローの実装
Anthropic は、Claude Code に動的ワークフロー機能を追加し、あらゆるタスクに対応するハッチを提供した。これにより開発者の作業効率が向上する。
[AINews] アンソロピックがシリーズ H で 9650 億ドルを調達、Opus 4.8 と Dynamic Workflows/ultracode を発表
アンソロピックは時価総額 9000 億ドルでシリーズ H ラウンドから 650 億ドル(一部はハイパースケイラーからの出資を含む)を調達し、収益年率を 470 億ドルに引き上げたと発表した。同社はこれに伴い、新モデル「Opus 4.8」とワークフロー機能「Dynamic Workflows/ultracode」も公開した。
動的ワークフローの紹介(3 分読了)
Jarred Sumner は動的ワークフローを活用し、Bun を Zig から Rust に書き換え、11 日間で 75 万行のコードを処理してテストスイートの成功率 99.8% を達成した。この手法では Claude がタスクを細分化し、エージェントが並列実行して結果が収束するまで動作する。
RSI が新たな AGI に — 定義が極めて困難であることにも変わりはない
TechCrunch AI は、人工一般知能(AGI)の概念に代わる指標として「RSI」を提案している。しかし、この RSI も AGI と同様に明確な定義や測定基準を確立することが極めて難しいと指摘している。
AI コーディングスタートアップ Cognition が 250 億ドルの企業価値で 10 億ドルを調達
AI コーディング分野のスタートアップである Cognition が、事前評価額 250 億ドル(約 3.7 兆円)で 10 億ドル(約 1,480 億円)の資金調達に成功した。この大口投資により同社は業界内での地位をさらに強化する見込みである。
Claude を製品間でどのように統制するか(28 分読)
Anthropic は、AI エージェントのシステムレベルでの相互作用を考慮し、環境層で統制設計を行い、モデル層で行動誘導を行うことで、ユーザーの監視能力に応じた隔離強度を実現し、潜在的な被害にハード制限を設ける重要性を説明している。
Google I/O 2026 デベロッパー基調講演のニュースまとめ
Google は支援型 AI から自律型エージェントへの移行を発表し、Gemini 3.5 シリーズの発売と Antigravity エージェントファースト開発プラットフォームの大幅更新を明らかにした。また、モバイル開発者向けに新 Android CLI ツールや評価リーダーボードも紹介された。
自己改善型 AI 構築へ 40 億ドル規模の資金調達、著名研究者が参画
Recursive Superintelligence は、人間開発者の支援を最小限に抑えた自己改善型 AI の構築を目指し、評価額 40 億ドル超で 6.5 億ドル以上の資金調達を実施した。同社の共同創設者 7 名は、主要 AI 企業出身の著名研究者らで構成されている。
本日は特に目立った出来事なし
AIニュースの週報(2026年5月6日〜8日)において、12件のサブレッドや544件のツイートを調査したが、特筆すべき技術進展や業界動向は確認されなかった。
Coinbase と Stripe を活用した Amazon Bedrock AgentCore Payments の発表
Amazon は AI エージェントが決済を実行できる新機能「AgentCore Payments」を発表し、Coinbase と Stripe と連携して多段階タスクの自動化を可能にした。
Anthropic の Claude マネージドエージェントが「夢」を見る機能を導入
AI 企業 Anthropic は、開発者会議で Claude マネージドエージェントに「夢」と呼ぶ新機能を公開した。これは直近の出来事を分析し、将来のタスクや対話に役立つ情報を記憶として保存するプロセスである。この機能は現在、研究プレビュー段階であり、Claude プラットフォーム上のマネージドエージェント限定で利用可能だ。
英国の数学者が AI エージェントにクレジットカードを任せる実験、パスワード漏洩や CAPTCHA の混乱など示す
イギリスの数学者ハンナ・フライ教授は、AI エージェントに銀行カード番号を与えてタスクを実行させる実験を行い、パスワードの漏洩や CAPTCHA の混乱などのリスクを示した。
Import AI 455:AI 研究の自動化
Jack Clark は、AI システムが自らを構築し始めるという新たな局面について解説している。この変化は、従来の人間中心の研究プロセスから、自律的なシステムによる研究開発への転換を意味する。
Claude Security が一般ベータ版へ(4 分読了)
Anthropic は Claude Enterprise ユーザー向けに、Opus 4.7 モデルを活用したソフトウェア脆弱性の特定と修正を行う「Claude Security」の一般ベータ版を開始しました。マイクロソフトセキュリティやパロアルトネットワークスなどのパートナー企業が使用するツールに統合され、カスタム API 統合なしで効率的な継続的なコードスキャンを可能にし、数百組織からのフィードバックにより機能が強化されています。
エージェントがクラウドフラレアカウント作成やドメイン購入、デプロイを可能に
コーディングエージェントが、従来の人手が必要なクラウドサービスのアカウント作成、支払い手段の確保、API トークン取得といった手順を自律的に実行できるようになり、Cloudflare 上でアプリケーションのデプロイが可能となった。
AWS、自律型エージェントをエンタープライズAIの次世代として本格推進
AWSは、自律型で長時間稼働するエージェントをエンタープライズAIの次世代の主流として位置づけ、その普及を本格推進している。
【AIニュース】プルリクエストの終焉(2005-2026)
GitHubはオープンソースリポジトリでプルリクエスト機能を無効にするオプションを初めて導入した。これは15年間コード開発の標準だったプルリクエストという概念の変革を示唆し、従来のコードレビュープロセスに新たな変化をもたらす可能性がある。
スキルを備えたADKエージェント構築の開発者ガイド
GoogleのAgent Development Kit(ADK)SkillToolsetは、AIエージェントが要求に応じてドメイン知識を読み込める「段階的開示」アーキテクチャを導入し、従来の単一プロンプトと比較してトークン使用量を最大90%削減する。
AWSがセキュリティテストとクラウド運用のためのフロンティアエージェントをローンチ
AWSは、オンデマンドのペネトレーションテストを行う「AWS Security Agent」と「AWS DevOps Agent」を一般提供開始した。これらはre:Inventで発表された自律型AIシステム「フロンティアエージェント」の新カテゴリを代表する。
DevOpsチームなしでグローバル規模を実現する2つのスタートアップ
Leonardo.AIは世界中で毎日450万枚以上の画像を処理し、Relevance AIはタイムゾーンを超えてSalesforceやSlackなどのシステムで自律的に動作するエージェントを運用している。両社とも専任のDevOpsチームを持たない運用モデルを採用しており、APAC地域では1,000社以上のAIネイティブスタートアップが同モデルを採用している。
自動実行エージェントを構築する
Cursorが、ユーザー定義のトリガーと指示に基づいて実行する自動化機能をサポートした。
2026年にソフトウェアがどのように構築されるかを定義する8つのトレンド
記事は、2026年までにソフトウェア開発の方法を定義する8つの主要なトレンドを提示している。これには、AI支援コーディング、低コード/ノーコードプラットフォームの普及、クラウドネイティブ開発の進化、セキュリティの左シフト、分散チームのためのコラボレーションツールの向上、持続可能なソフトウェア開発の重視、エッジコンピューティングの統合、および開発者体験の最適化が含まれる。
長期間自律的なコーディングのスケーリング
研究チームが、数週間にわたって自律的に動作するコーディングエージェントの実験を実施し、長期間の自律コーディングの実現可能性を探っている。
Cowork: あなたの残りの仕事のためのClaude Code
AnthropicがClaude Codeを発表した。このツールは開発者のコーディング作業を支援するAI機能であり、コード生成やデバッグを効率化する。
プロジェクト・ヴェンド:フェーズ2
プロジェクト・ヴェンドがフェーズ2に移行した。具体的な内容は不明だが、AI/テクノロジー分野における継続的な取り組みを示している。
GPT-5:ただ、それを実行するだけ
筆者はGPT-5への早期アクセス権を持ち、その重要性を評価している。特定の指示を含むプロンプトを入力したところ、24秒間の思考を経て劇的な出力を生成し、その能力の高さを示した。
Devinとの1ヶ月間の考察
2024年3月、Founders Fundらが支援するAI企業IOIが、全自動ソフトウェアエンジニア「Devin」を公開した。IOIメダリストらによって開発されたDevinは、人間のような対話で自律的にプログラミングタスクを遂行する製品である。
LLM搭載の自律型エージェント
大規模言語モデル(LLM)を中核コントローラーとする自律型エージェントの構築は、AutoGPTやBabyAGIなどの概念実証デモにより示唆されるように、単なるコンテンツ生成を超えた可能性を秘めている。