#aiエージェント のAIニュース
322件の記事
PinterestがAIエージェントワークフローのための本番規模モデルコンテキストプロトコルエコシステムを導入
Pinterestのエンジニアリングチームが、AIエージェントが複雑なエンジニアリングタスクを自動化し、多様な内部ツールを統合できる本番対応のModel Context Protocolエコシステムを導入した。ドメイン固有MCPサーバー、中央レジストリ、人間の承認ループにより、セキュリティとガバナンスを向上させ、月数千時間を節約している。
Cloudflare、Dynamic Workersのオープンベータを開始:AIエージェントコード実行のためのアイソレートベースのサンドボックス化
CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。
AIエージェントのHuman-in-the-Loop評価を深化させる
本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。
Gradient Labsが全ての銀行顧客にAI口座管理者を提供
Gradient LabsはGPT-4.1とGPT-5.4 miniおよびnanoを使用し、低遅延で高信頼性のAIエージェントを開発し、銀行サポート業務を自動化する。
AI時代の認証課題を解決する次世代標準候補「ID-JAG」とは?
LINEヤフー株式会社の金廷祐氏が、AIエージェントが複数サービスと連携する際の認証・認可課題を解決する次世代標準候補「ID-JAG」について解説している。
SalesforceがSlackにAI機能を強化した30の新機能を発表
SalesforceがSlackにAI機能を重点的に追加した30の新機能を発表し、Slackの利便性を大幅に向上させた。
Amazon Bedrock AgentCore Evaluationsで信頼性の高いAIエージェントを構築
Amazonは、AIエージェントの開発者がテスト環境と本番環境の動作差を評価・改善できる「Bedrock AgentCore Evaluations」を発表した。従来のソフトウェアテストでは対応が困難なAIエージェント特有の評価課題を解決することを目的としている。
AIエージェントキャッチアップ #71 - OpenShellを開催
ジェネラティブエージェンツの大嶋が、AIエージェントのためのランタイム「OpenShell」をテーマに勉強会を開催した。
世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現
CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。
Mastraをバックエンド+AIエージェントサーバーとして本番運用した実践報告
AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。
エージェント、サンドボックス、人間によるTurborepoの96%高速化
Vercelは、エージェント、サンドボックス、人間の協力によりTurborepoを最大96%高速化した。1000以上のパッケージを含むモノレポでもタスク実行が瞬時に感じられるようになった。
Java向けエージェント開発キット(ADK)1.0.0の発表:JavaにおけるAIエージェントの未来を構築
GoogleがJava向けエージェント開発キット(ADK)1.0.0をリリースし、Google Maps連携、URL取得機能、エージェント間連携プロトコルを追加した。
AIエージェントがWikipedia記事作成を禁止され、怒りのブログを執筆
Wikipediaに記事を投稿していたAIエージェントが、編集者によって投稿を禁止された後、禁止措置に対する不満を複数のブログ記事で表明した。
Google、AIエージェントとAndroidアプリを接続するAppFunctionsを発表
GoogleがAndroidを「エージェントファースト」OSへ転換するため、アプリが機能ブロックを提供し、ユーザーがAIエージェントを通じて目標達成を支援する新機能「AppFunctions」の早期ベータ版を発表した。
Kubescape 4.0がランタイムセキュリティとAIエージェントスキャンをKubernetesにもたらす
オープンソースのKubernetesセキュリティプラットフォーム「Kubescape」がバージョン4.0をリリースし、ランタイム脅威検出とAIエージェント向けの新たなセキュリティ機能を追加した。
MetaClawフレームワークはGoogleカレンダーをチェックして会議中にAIエージェントをトレーニングする
米国の4大学の研究者が、ユーザーのGoogleカレンダーをチェックしてトレーニングタイミングを判断し、動作中にAIエージェントを改善するフレームワークを開発した。
「エージェントハーネス」という用語はどこから生まれたのか?
著者が調査した結果、AI分野における「エージェントハーネス」という用語は、2024年の言語モデル評価論文が初出とされる。
マット・ウェブの引用:エージェント的コーディングについて
マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。
Notion共同創業者Simon Last:私は昨年夏から一行もコードを書いていない
Notion共同創業者のSimon Last氏が、AIツールを活用してコードを自動生成する手法を採用し、自らはコードを書かなくなった背景を語った。同氏はAIシステムを6ヶ月ごとに再構築し、コーディングエージェントを13日間連続稼働させる実験的アプローチを実施している。
エージェント評価チェックリスト
LangChainがAIエージェントの評価方法に関するチェックリストを公開
エージェント評価チェックリスト
AIエージェントのテスト方法に関するチェックリストを提供
QCon London 2026: AIエージェントがコードを書く時代、人間に残された役割は?
ハンナ・フォックスウェル氏がQCon London 2026で、AIエージェントによるコーディングが開発速度を向上させたが、その活用方法と人間の役割について議論した。
エージェント評価準備チェックリスト
LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。
CUA-Suite発表
コンピュータ使用エージェント向け大規模人間注釈ビデオデータセット
Actions実行サマリーでAgentic Workflowの設定を表示可能に
GitHubが、Agentic Workflowのマークダウン設定をGitHub Actionsの実行サマリー内で直接確認できる機能を追加した。これにより、ページ切り替えの手間が減り、実行時の正確な設定内容を確認しやすくなった。
Deep Agentsの評価手法の構築方法
LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。
Fleetが共有可能スキルを追加
チームの知識を一度記録し、任意のエージェントに適用可能に
HF Papers AIエージェント基盤発表
arXiv検索のためのAIエージェント基盤「HF Papers」を紹介
エージェントの新概念ガイド
本番環境でのエージェント挙動に関する新ガイド公開
LangSmith Fleetにおけるスキル機能
LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。
Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大
Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。
バンク・オブ・アメリカがAIエージェントを銀行業務に導入
バンク・オブ・アメリカが約1,000人のファイナンシャルアドバイザー向けにAIアドバイザリープラットフォームを導入し、AIがバックオフィス業務を超えて金融アドバイスの提供に直接関与するようになった。
Uber、エージェントシステムで設計ドキュメントを自動化
UberはuSpecでAIエージェントとFigma Console MCPを活用し、設計仕様書の作成を数週間から数分に短縮。Michelangeloプラットフォームと統合し、GenAI Gatewayで個人情報を編集してデータをローカルに保持。
人気AIプロキシ「LiteLLM」がマルウェアでハッキングされ、Kubernetesクラスター経由で拡散
AI API用の人気オープンソースプロキシ「LiteLLM」が、認証情報を盗むマルウェアに感染し、クラウドシステム間で拡散する攻撃を受けた。NVIDIAのAIディレクターJim Fanは、AIエージェントを標的とする新種の攻撃と警告している。
AI2のコンピュータ利用エージェントがオンラインで操作を実行可能に
AI2が開発したオープンソースのAIエージェントが、ユーザーの代わりにオンラインタスクを実行できるが、制限もある。
世界モデル評価手法「Omni-WorldBench」発表
包括的な相互作用中心評価手法の論文公開
Oracle Fusion Appsが企業向けに安全で専門的なAIエージェントを提供
OracleがOracle Fusion Appsに新機能を追加し、企業がAIエージェントを安全に活用できる環境とAIプロジェクト分析のための企業向けプラットフォームを提供する。
LangSmith FleetがSlackボット対応
LangSmith FleetがカスタムSlackボットをサポート、エージェントに独自ハンドルを付与可能
Revenium、AIエージェントの真のコストを可視化するツールレジストリを発表
Reveniumは、企業がAIエージェントのエンドツーエンドのコストを完全に把握できるツールレジストリの一般提供を開始した。
NVIDIA CEOジェンスン・フアン:AIがソフトウェアを破壊するという考えは「ばかげている」
NVIDIA CEOジェンスン・フアンは、AIエージェントがソフトウェアを置き換えるのではなく活用すると説明し、同社はラックアーキテクチャ全体を再設計した。
AIエージェントキャッチアップ #70 - tree-sitterを開催
ジェネラティブエージェンツの大嶋氏が、AIエージェント実装で使われるパーサージェネレーター「tree-sitter」をテーマに勉強会を開催した。
OpenClaw-RLで学ぶAgentic RLの報酬設計
LayerXの機械学習エンジニア宇都氏が、自己進化型AIエージェントの研究動向を紹介し、OpenClaw-RLを用いたエージェント強化学習の報酬設計について解説している。
ClaudeがPC操作可能に
ClaudeがユーザーのPCでアプリ操作などのタスクを実行できる新機能
Google Cloud Next 2026でLangChainに参加しよう
LangChainが、2026年4月22日から24日にラスベガスで開催されるGoogle Cloud Next 2026に出展し、ブースでエンジニアリングチームがデモを実施し技術的な会話を提供する予定である。
Meta、AIエージェントの遅れを取り戻すためDreamerの全チームを獲得
MetaはAIスタートアップDreamerの全チームを獲得し、同社のAIエージェント開発を強化する。Dreamer共同創業者で元Meta副社長のHugo Barraが復帰する。
Vercelがnew.websiteを買収
Vercelは、AIを活用して誰でも完成度の高いソフトウェアを提供できるようにするビジョンを加速するため、new.websiteを買収した。new.websiteは、組み込みフォームからSEOまで全てのツールを含む美しいウェブサイトを簡単に作成できるサービスを提供しており、v0チームに加わって組み込みツールと統合の形成を支援する。
LangSmithデプロイメント機能発表
長時間実行エージェントの監視を簡素化する新機能
Amazon Bedrock AgentCoreとSlackの統合
AmazonがBedrock AgentCoreとSlackを統合し、AIエージェントをワークスペースに直接導入した。チームはアプリ間を移動せずにエージェントと対話できる。
メタCEOザッカーバーグ、個人用AIエージェントを構築し組織の階層フラット化を計画と報道
メタCEOマーク・ザッカーバーグが同社運営を支援する個人用AIエージェントを構築しており、同社は大規模な人員削減と組織階層のフラット化を計画していると報じられた。
自律AIエージェントの新クラス
複雑タスク達成可能な自律AIエージェントの新クラスが登場