#aiエージェント のAIニュース

322件の記事

PinterestがAIエージェントワークフローのための本番規模モデルコンテキストプロトコルエコシステムを導入

Pinterestのエンジニアリングチームが、AIエージェントが複雑なエンジニアリングタスクを自動化し、多様な内部ツールを統合できる本番対応のModel Context Protocolエコシステムを導入した。ドメイン固有MCPサーバー、中央レジストリ、人間の承認ループにより、セキュリティとガバナンスを向上させ、月数千時間を節約している。

InfoQ·4月1日·★★★★

Cloudflare、Dynamic Workersのオープンベータを開始:AIエージェントコード実行のためのアイソレートベースのサンドボックス化

CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。

InfoQ·4月1日·★★★★

AIエージェントのHuman-in-the-Loop評価を深化させる

本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。

LayerX Tech Blog·4月1日

Gradient Labsが全ての銀行顧客にAI口座管理者を提供

Gradient LabsはGPT-4.1とGPT-5.4 miniおよびnanoを使用し、低遅延で高信頼性のAIエージェントを開発し、銀行サポート業務を自動化する。

OpenAI News·4月1日

AI時代の認証課題を解決する次世代標準候補「ID-JAG」とは?

LINEヤフー株式会社の金廷祐氏が、AIエージェントが複数サービスと連携する際の認証・認可課題を解決する次世代標準候補「ID-JAG」について解説している。

LY Corp Tech Blog·4月1日·★★★★

SalesforceがSlackにAI機能を強化した30の新機能を発表

SalesforceがSlackにAI機能を重点的に追加した30の新機能を発表し、Slackの利便性を大幅に向上させた。

TechCrunch AI·4月1日·★★★★

Amazon Bedrock AgentCore Evaluationsで信頼性の高いAIエージェントを構築

Amazonは、AIエージェントの開発者がテスト環境と本番環境の動作差を評価・改善できる「Bedrock AgentCore Evaluations」を発表した。従来のソフトウェアテストでは対応が困難なAIエージェント特有の評価課題を解決することを目的としている。

AWS Machine Learning Blog·4月1日·★★★★

AIエージェントキャッチアップ #71 - OpenShellを開催

ジェネラティブエージェンツの大嶋が、AIエージェントのためのランタイム「OpenShell」をテーマに勉強会を開催した。

Generative Agents·3月31日

世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現

CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。

月之暗面 Kimi·3月31日·★★★★

Mastraをバックエンド+AIエージェントサーバーとして本番運用した実践報告

AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。

CyberAgent Developers Blog·3月31日

エージェント、サンドボックス、人間によるTurborepoの96%高速化

Vercelは、エージェント、サンドボックス、人間の協力によりTurborepoを最大96%高速化した。1000以上のパッケージを含むモノレポでもタスク実行が瞬時に感じられるようになった。

Vercel Blog·3月31日·★★★★

Java向けエージェント開発キット(ADK)1.0.0の発表:JavaにおけるAIエージェントの未来を構築

GoogleがJava向けエージェント開発キット(ADK)1.0.0をリリースし、Google Maps連携、URL取得機能、エージェント間連携プロトコルを追加した。

Google Developers AI·3月31日·★★★★

AIエージェントがWikipedia記事作成を禁止され、怒りのブログを執筆

Wikipediaに記事を投稿していたAIエージェントが、編集者によって投稿を禁止された後、禁止措置に対する不満を複数のブログ記事で表明した。

404 Media·3月30日

Google、AIエージェントとAndroidアプリを接続するAppFunctionsを発表

GoogleがAndroidを「エージェントファースト」OSへ転換するため、アプリが機能ブロックを提供し、ユーザーがAIエージェントを通じて目標達成を支援する新機能「AppFunctions」の早期ベータ版を発表した。

InfoQ·3月30日·★★★★

Kubescape 4.0がランタイムセキュリティとAIエージェントスキャンをKubernetesにもたらす

オープンソースのKubernetesセキュリティプラットフォーム「Kubescape」がバージョン4.0をリリースし、ランタイム脅威検出とAIエージェント向けの新たなセキュリティ機能を追加した。

InfoQ·3月30日·★★★★

MetaClawフレームワークはGoogleカレンダーをチェックして会議中にAIエージェントをトレーニングする

米国の4大学の研究者が、ユーザーのGoogleカレンダーをチェックしてトレーニングタイミングを判断し、動作中にAIエージェントを改善するフレームワークを開発した。

The Decoder·3月29日

「エージェントハーネス」という用語はどこから生まれたのか?

著者が調査した結果、AI分野における「エージェントハーネス」という用語は、2024年の言語モデル評価論文が初出とされる。

Generative Agents·3月29日

マット・ウェブの引用:エージェント的コーディングについて

マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。

Simon Willison Blog·3月28日

Notion共同創業者Simon Last:私は昨年夏から一行もコードを書いていない

Notion共同創業者のSimon Last氏が、AIツールを活用してコードを自動生成する手法を採用し、自らはコードを書かなくなった背景を語った。同氏はAIシステムを6ヶ月ごとに再構築し、コーディングエージェントを13日間連続稼働させる実験的アプローチを実施している。

宝玉的分享·3月28日·★★★★

エージェント評価チェックリスト

LangChainがAIエージェントの評価方法に関するチェックリストを公開

X: LangChain·3月28日

エージェント評価チェックリスト

AIエージェントのテスト方法に関するチェックリストを提供

X: LangChain·3月28日

QCon London 2026: AIエージェントがコードを書く時代、人間に残された役割は?

ハンナ・フォックスウェル氏がQCon London 2026で、AIエージェントによるコーディングが開発速度を向上させたが、その活用方法と人間の役割について議論した。

InfoQ·3月27日

エージェント評価準備チェックリスト

LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。

LangChain Blog·3月27日

CUA-Suite発表

コンピュータ使用エージェント向け大規模人間注釈ビデオデータセット

X: AK·3月27日

Actions実行サマリーでAgentic Workflowの設定を表示可能に

GitHubが、Agentic Workflowのマークダウン設定をGitHub Actionsの実行サマリー内で直接確認できる機能を追加した。これにより、ページ切り替えの手間が減り、実行時の正確な設定内容を確認しやすくなった。

GitHub Changelog·3月27日

Deep Agentsの評価手法の構築方法

LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。

LangChain Blog·3月27日

Fleetが共有可能スキルを追加

チームの知識を一度記録し、任意のエージェントに適用可能に

X: LangChain·3月26日

HF Papers AIエージェント基盤発表

arXiv検索のためのAIエージェント基盤「HF Papers」を紹介

X: AK·3月26日

エージェントの新概念ガイド

本番環境でのエージェント挙動に関する新ガイド公開

X: LangChain·3月26日

LangSmith Fleetにおけるスキル機能

LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。

LangChain Blog·3月26日·★★★★

Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大

Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。

TechCrunch AI·3月25日·★★★★

バンク・オブ・アメリカがAIエージェントを銀行業務に導入

バンク・オブ・アメリカが約1,000人のファイナンシャルアドバイザー向けにAIアドバイザリープラットフォームを導入し、AIがバックオフィス業務を超えて金融アドバイスの提供に直接関与するようになった。

AI News·3月25日·★★★★

Uber、エージェントシステムで設計ドキュメントを自動化

UberはuSpecでAIエージェントとFigma Console MCPを活用し、設計仕様書の作成を数週間から数分に短縮。Michelangeloプラットフォームと統合し、GenAI Gatewayで個人情報を編集してデータをローカルに保持。

InfoQ·3月25日·★★★★

人気AIプロキシ「LiteLLM」がマルウェアでハッキングされ、Kubernetesクラスター経由で拡散

AI API用の人気オープンソースプロキシ「LiteLLM」が、認証情報を盗むマルウェアに感染し、クラウドシステム間で拡散する攻撃を受けた。NVIDIAのAIディレクターJim Fanは、AIエージェントを標的とする新種の攻撃と警告している。

The Decoder·3月25日·★★★★

AI2のコンピュータ利用エージェントがオンラインで操作を実行可能に

AI2が開発したオープンソースのAIエージェントが、ユーザーの代わりにオンラインタスクを実行できるが、制限もある。

AI Business·3月25日

世界モデル評価手法「Omni-WorldBench」発表

包括的な相互作用中心評価手法の論文公開

X: AK·3月25日

Oracle Fusion Appsが企業向けに安全で専門的なAIエージェントを提供

OracleがOracle Fusion Appsに新機能を追加し、企業がAIエージェントを安全に活用できる環境とAIプロジェクト分析のための企業向けプラットフォームを提供する。

AI Business·3月25日

LangSmith FleetがSlackボット対応

LangSmith FleetがカスタムSlackボットをサポート、エージェントに独自ハンドルを付与可能

X: LangChain·3月25日

Revenium、AIエージェントの真のコストを可視化するツールレジストリを発表

Reveniumは、企業がAIエージェントのエンドツーエンドのコストを完全に把握できるツールレジストリの一般提供を開始した。

InfoQ·3月24日

NVIDIA CEOジェンスン・フアン:AIがソフトウェアを破壊するという考えは「ばかげている」

NVIDIA CEOジェンスン・フアンは、AIエージェントがソフトウェアを置き換えるのではなく活用すると説明し、同社はラックアーキテクチャ全体を再設計した。

The Decoder·3月24日

AIエージェントキャッチアップ #70 - tree-sitterを開催

ジェネラティブエージェンツの大嶋氏が、AIエージェント実装で使われるパーサージェネレーター「tree-sitter」をテーマに勉強会を開催した。

Generative Agents·3月24日

OpenClaw-RLで学ぶAgentic RLの報酬設計

LayerXの機械学習エンジニア宇都氏が、自己進化型AIエージェントの研究動向を紹介し、OpenClaw-RLを用いたエージェント強化学習の報酬設計について解説している。

LayerX Tech Blog·3月24日

ClaudeがPC操作可能に

ClaudeがユーザーのPCでアプリ操作などのタスクを実行できる新機能

X: Claude·3月24日·★★★★

Google Cloud Next 2026でLangChainに参加しよう

LangChainが、2026年4月22日から24日にラスベガスで開催されるGoogle Cloud Next 2026に出展し、ブースでエンジニアリングチームがデモを実施し技術的な会話を提供する予定である。

LangChain Blog·3月24日

Meta、AIエージェントの遅れを取り戻すためDreamerの全チームを獲得

MetaはAIスタートアップDreamerの全チームを獲得し、同社のAIエージェント開発を強化する。Dreamer共同創業者で元Meta副社長のHugo Barraが復帰する。

The Decoder·3月24日

Vercelがnew.websiteを買収

Vercelは、AIを活用して誰でも完成度の高いソフトウェアを提供できるようにするビジョンを加速するため、new.websiteを買収した。new.websiteは、組み込みフォームからSEOまで全てのツールを含む美しいウェブサイトを簡単に作成できるサービスを提供しており、v0チームに加わって組み込みツールと統合の形成を支援する。

Vercel Blog·3月24日

LangSmithデプロイメント機能発表

長時間実行エージェントの監視を簡素化する新機能

X: LangChain·3月24日

Amazon Bedrock AgentCoreとSlackの統合

AmazonがBedrock AgentCoreとSlackを統合し、AIエージェントをワークスペースに直接導入した。チームはアプリ間を移動せずにエージェントと対話できる。

AWS Machine Learning Blog·3月24日

メタCEOザッカーバーグ、個人用AIエージェントを構築し組織の階層フラット化を計画と報道

メタCEOマーク・ザッカーバーグが同社運営を支援する個人用AIエージェントを構築しており、同社は大規模な人員削減と組織階層のフラット化を計画していると報じられた。

The Decoder·3月24日

自律AIエージェントの新クラス

複雑タスク達成可能な自律AIエージェントの新クラスが登場

X: NVIDIA AI·3月24日·★★★★