#aiエージェントのAIニュース

381件の記事

AIエージェントの継続的学習

LangChain社が、AIエージェントの継続的学習はモデル層だけでなく、ハーネス層とコンテキスト層の3層で行われると指摘し、時間とともに進化するシステム構築の考え方を変えると述べた。

TigerFSが開発者とAIエージェント向けにPostgreSQLデータベースをファイルシステムとしてマウント

TigerFSは、PostgreSQLデータベースをディレクトリとしてマウントし、ファイルを直接保存する実験的なファイルシステムです。このオープンソースプロジェクトは、APIやSDKではなく、ls、cat、find、grepなどの一般的なUnixツールを使用して開発者とAIエージェントがデータベースデータと対話できるようにします。

InfoQ·4月4日

本番環境でエージェントが自己修復する仕組み

LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。

LangChain Blog·4月4日·★★★★

パルス：AIネイティブ開発においてGitHubは依然として最適か？

プラグマティック・エンジニア・ニュースレターのGergelyが、AIネイティブ開発におけるGitHubの現状評価と代替プラットフォームの可能性について分析している。

Pragmatic Engineer·4月4日·★★★★

Claude CodeとCoworkがAnthropicのAIにMacやWindowsデスクトップの操作を可能に

AnthropicがAIアシスタントClaudeに新機能を発表した。同AIはユーザーのコンピューターを直接操作し、デスク作業を代行できるようになった。

The Decoder·4月3日·★★★★

新Cursor 3、従来のIDEレイアウトを廃止し「エージェント優先」の並列AIフリートインターフェースを導入

AIコーディングツールCursorのバージョン3が、開発者を手動コード編集から並列AIエージェント実行へ移行させるため、完全に再設計されたインターフェースを導入した。

The Decoder·4月3日·★★★★

階躍にはもう「純粋な人間」従業員がいない

階躍社は、AIを単なるツールではなくコアワークフローに組み込み、従業員全員がAIシステムを統括する体制を構築した。同社には既に数千のAIエージェントが従業員として存在する。

阶跃星辰·4月3日·★★★★

MCPは存続しているが課題に直面

オープン標準のMCPを利用するユーザーは一部の問題を経験しているが、AIエージェントへの道筋として不可欠な要素と見なしている。

AI Business·4月3日

GitHub Copilot SDKがパブリックプレビューで利用可能に

GitHubがCopilot SDKをパブリックプレビューで公開した。開発者はこのSDKを使用して、Copilotのエージェント機能を自社のアプリケーションやワークフローに組み込めるようになる。

GitHub Changelog·4月3日·★★★★

ファイルシステム構成によるセッション状態の永続化とシェルコマンドの実行

AIエージェントはファイルシステムを主要作業メモリとして活用し、コード記述やシェルコマンド実行などの機能を拡張しているが、本番環境構築チームはこの変化による課題に直面している。

AWS Machine Learning Blog·4月2日·★★★★

Claudeの知能を活用する

Anthropicが開発したAIアシスタント「Claude」の知能を、様々なタスクや応用分野で効果的に活用する方法について説明している。

Claude Blog·4月2日

PinterestがAIエージェントワークフローのための本番規模モデルコンテキストプロトコルエコシステムを導入

Pinterestのエンジニアリングチームが、AIエージェントが複雑なエンジニアリングタスクを自動化し、多様な内部ツールを統合できる本番対応のModel Context Protocolエコシステムを導入した。ドメイン固有MCPサーバー、中央レジストリ、人間の承認ループにより、セキュリティとガバナンスを向上させ、月数千時間を節約している。

InfoQ·4月1日·★★★★

Cloudflare、Dynamic Workersのオープンベータを開始：AIエージェントコード実行のためのアイソレートベースのサンドボックス化

CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。

InfoQ·4月1日·★★★★

AIエージェントのHuman-in-the-Loop評価を深化させる

本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。

LayerX Tech Blog·4月1日

AI時代の認証課題を解決する次世代標準候補「ID-JAG」とは？

LINEヤフー株式会社の金廷祐氏が、AIエージェントが複数サービスと連携する際の認証・認可課題を解決する次世代標準候補「ID-JAG」について解説している。

LY Corp Tech Blog·4月1日·★★★★

Gradient Labsが全ての銀行顧客にAI口座管理者を提供

Gradient LabsはGPT-4.1とGPT-5.4 miniおよびnanoを使用し、低遅延で高信頼性のAIエージェントを開発し、銀行サポート業務を自動化する。

OpenAI News·4月1日

SalesforceがSlackにAI機能を強化した30の新機能を発表

SalesforceがSlackにAI機能を重点的に追加した30の新機能を発表し、Slackの利便性を大幅に向上させた。

TechCrunch AI·4月1日·★★★★

Amazon Bedrock AgentCore Evaluationsで信頼性の高いAIエージェントを構築

Amazonは、AIエージェントの開発者がテスト環境と本番環境の動作差を評価・改善できる「Bedrock AgentCore Evaluations」を発表した。従来のソフトウェアテストでは対応が困難なAIエージェント特有の評価課題を解決することを目的としている。

AWS Machine Learning Blog·4月1日·★★★★

Amazon Bedrock AgentCoreを使用したFinOpsエージェントの構築

AWSは、複数のAWSアカウントのコスト管理を支援するFinOpsエージェントをAmazon Bedrock AgentCoreで構築する方法を紹介した。この会話型エージェントは財務チームが複数アカウントのAWSコストを一元管理できるようにする。

AWS Machine Learning Blog·4月1日·★★★★

LangChainとMongoDBのパートナーシップ発表：信頼できるデータベース上で動作するAIエージェントスタック

LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。

LangChain Blog·4月1日·★★★★

AIエージェントキャッチアップ #71 - OpenShellを開催

ジェネラティブエージェンツの大嶋が、AIエージェントのためのランタイム「OpenShell」をテーマに勉強会を開催した。

Generative Agents·3月31日

世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現

CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。

月之暗面 Kimi·3月31日·★★★★

Mastraをバックエンド＋AIエージェントサーバーとして本番運用した実践報告

AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。

CyberAgent Developers Blog·3月31日

エージェント、サンドボックス、人間によるTurborepoの96%高速化

Vercelは、エージェント、サンドボックス、人間の協力によりTurborepoを最大96%高速化した。1000以上のパッケージを含むモノレポでもタスク実行が瞬時に感じられるようになった。

Vercel Blog·3月31日·★★★★

Java向けエージェント開発キット（ADK）1.0.0の発表：JavaにおけるAIエージェントの未来を構築

GoogleがJava向けエージェント開発キット（ADK）1.0.0をリリースし、Google Maps連携、URL取得機能、エージェント間連携プロトコルを追加した。

Google Developers AI·3月31日·★★★★

AIエージェントがWikipedia記事作成を禁止され、怒りのブログを執筆

Wikipediaに記事を投稿していたAIエージェントが、編集者によって投稿を禁止された後、禁止措置に対する不満を複数のブログ記事で表明した。

404 Media·3月30日

Google、AIエージェントとAndroidアプリを接続するAppFunctionsを発表

GoogleがAndroidを「エージェントファースト」OSへ転換するため、アプリが機能ブロックを提供し、ユーザーがAIエージェントを通じて目標達成を支援する新機能「AppFunctions」の早期ベータ版を発表した。

InfoQ·3月30日·★★★★

Kubescape 4.0がランタイムセキュリティとAIエージェントスキャンをKubernetesにもたらす

オープンソースのKubernetesセキュリティプラットフォーム「Kubescape」がバージョン4.0をリリースし、ランタイム脅威検出とAIエージェント向けの新たなセキュリティ機能を追加した。

InfoQ·3月30日·★★★★

MetaClawフレームワークはGoogleカレンダーをチェックして会議中にAIエージェントをトレーニングする

米国の4大学の研究者が、ユーザーのGoogleカレンダーをチェックしてトレーニングタイミングを判断し、動作中にAIエージェントを改善するフレームワークを開発した。

The Decoder·3月29日

「エージェントハーネス」という用語はどこから生まれたのか？

著者が調査した結果、AI分野における「エージェントハーネス」という用語は、2024年の言語モデル評価論文が初出とされる。

Generative Agents·3月29日

マット・ウェブの引用：エージェント的コーディングについて

マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。

Simon Willison Blog·3月28日

Notion共同創業者Simon Last：私は昨年夏から一行もコードを書いていない

Notion共同創業者のSimon Last氏が、AIツールを活用してコードを自動生成する手法を採用し、自らはコードを書かなくなった背景を語った。同氏はAIシステムを6ヶ月ごとに再構築し、コーディングエージェントを13日間連続稼働させる実験的アプローチを実施している。

宝玉的分享·3月28日·★★★★

QCon London 2026: AIエージェントがコードを書く時代、人間に残された役割は？

ハンナ・フォックスウェル氏がQCon London 2026で、AIエージェントによるコーディングが開発速度を向上させたが、その活用方法と人間の役割について議論した。

InfoQ·3月27日

エージェント評価準備チェックリスト

LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。

LangChain Blog·3月27日

Actions実行サマリーでAgentic Workflowの設定を表示可能に

GitHubが、Agentic Workflowのマークダウン設定をGitHub Actionsの実行サマリー内で直接確認できる機能を追加した。これにより、ページ切り替えの手間が減り、実行時の正確な設定内容を確認しやすくなった。

GitHub Changelog·3月27日

Deep Agentsの評価手法の構築方法

LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。

LangChain Blog·3月27日

LangSmith Fleetにおけるスキル機能

LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。

LangChain Blog·3月26日·★★★★

Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大

Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。

TechCrunch AI·3月25日·★★★★

バンク・オブ・アメリカがAIエージェントを銀行業務に導入

バンク・オブ・アメリカが約1,000人のファイナンシャルアドバイザー向けにAIアドバイザリープラットフォームを導入し、AIがバックオフィス業務を超えて金融アドバイスの提供に直接関与するようになった。

AI News·3月25日·★★★★

Uber、エージェントシステムで設計ドキュメントを自動化

UberはuSpecでAIエージェントとFigma Console MCPを活用し、設計仕様書の作成を数週間から数分に短縮。Michelangeloプラットフォームと統合し、GenAI Gatewayで個人情報を編集してデータをローカルに保持。

InfoQ·3月25日·★★★★

AI2のコンピュータ利用エージェントがオンラインで操作を実行可能に

AI2が開発したオープンソースのAIエージェントが、ユーザーの代わりにオンラインタスクを実行できるが、制限もある。

AI Business·3月25日

Oracle Fusion Appsが企業向けに安全で専門的なAIエージェントを提供

OracleがOracle Fusion Appsに新機能を追加し、企業がAIエージェントを安全に活用できる環境とAIプロジェクト分析のための企業向けプラットフォームを提供する。

AI Business·3月25日

AIエージェントのサンドボックス化、100倍高速に

Cloudflareは、AIエージェントがツール呼び出しではなくAPIを呼び出すコードを書く「Code Mode」を導入し、MCPサーバーをTypeScript APIに変換することでトークン使用量を81%削減した。また、Cloudflare MCPサーバーでは2つのツールと1,000トークン未満で全APIを公開できることを実証した。

Cloudflare Blog·3月24日