#aiエージェント のAIニュース
381件の記事
AIエージェントの継続的学習
LangChain社が、AIエージェントの継続的学習はモデル層だけでなく、ハーネス層とコンテキスト層の3層で行われると指摘し、時間とともに進化するシステム構築の考え方を変えると述べた。
TigerFSが開発者とAIエージェント向けにPostgreSQLデータベースをファイルシステムとしてマウント
TigerFSは、PostgreSQLデータベースをディレクトリとしてマウントし、ファイルを直接保存する実験的なファイルシステムです。このオープンソースプロジェクトは、APIやSDKではなく、ls、cat、find、grepなどの一般的なUnixツールを使用して開発者とAIエージェントがデータベースデータと対話できるようにします。
本番環境でエージェントが自己修復する仕組み
LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。
パルス:AIネイティブ開発においてGitHubは依然として最適か?
プラグマティック・エンジニア・ニュースレターのGergelyが、AIネイティブ開発におけるGitHubの現状評価と代替プラットフォームの可能性について分析している。
Claude CodeとCoworkがAnthropicのAIにMacやWindowsデスクトップの操作を可能に
AnthropicがAIアシスタントClaudeに新機能を発表した。同AIはユーザーのコンピューターを直接操作し、デスク作業を代行できるようになった。
新Cursor 3、従来のIDEレイアウトを廃止し「エージェント優先」の並列AIフリートインターフェースを導入
AIコーディングツールCursorのバージョン3が、開発者を手動コード編集から並列AIエージェント実行へ移行させるため、完全に再設計されたインターフェースを導入した。
階躍にはもう「純粋な人間」従業員がいない
階躍社は、AIを単なるツールではなくコアワークフローに組み込み、従業員全員がAIシステムを統括する体制を構築した。同社には既に数千のAIエージェントが従業員として存在する。
MCPは存続しているが課題に直面
オープン標準のMCPを利用するユーザーは一部の問題を経験しているが、AIエージェントへの道筋として不可欠な要素と見なしている。
GitHub Copilot SDKがパブリックプレビューで利用可能に
GitHubがCopilot SDKをパブリックプレビューで公開した。開発者はこのSDKを使用して、Copilotのエージェント機能を自社のアプリケーションやワークフローに組み込めるようになる。
ファイルシステム構成によるセッション状態の永続化とシェルコマンドの実行
AIエージェントはファイルシステムを主要作業メモリとして活用し、コード記述やシェルコマンド実行などの機能を拡張しているが、本番環境構築チームはこの変化による課題に直面している。
Claudeの知能を活用する
Anthropicが開発したAIアシスタント「Claude」の知能を、様々なタスクや応用分野で効果的に活用する方法について説明している。
PinterestがAIエージェントワークフローのための本番規模モデルコンテキストプロトコルエコシステムを導入
Pinterestのエンジニアリングチームが、AIエージェントが複雑なエンジニアリングタスクを自動化し、多様な内部ツールを統合できる本番対応のModel Context Protocolエコシステムを導入した。ドメイン固有MCPサーバー、中央レジストリ、人間の承認ループにより、セキュリティとガバナンスを向上させ、月数千時間を節約している。
Cloudflare、Dynamic Workersのオープンベータを開始:AIエージェントコード実行のためのアイソレートベースのサンドボックス化
CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。
AIエージェントのHuman-in-the-Loop評価を深化させる
本記事は、AIエージェントのHuman-in-the-Loopを定量評価する手法とビジネス価値を検討し、評価の非対称性と総体性という2つの分析軸を導入して実践的な意思決定ツールに昇華させる方法を解説する。
AI時代の認証課題を解決する次世代標準候補「ID-JAG」とは?
LINEヤフー株式会社の金廷祐氏が、AIエージェントが複数サービスと連携する際の認証・認可課題を解決する次世代標準候補「ID-JAG」について解説している。
Gradient Labsが全ての銀行顧客にAI口座管理者を提供
Gradient LabsはGPT-4.1とGPT-5.4 miniおよびnanoを使用し、低遅延で高信頼性のAIエージェントを開発し、銀行サポート業務を自動化する。
SalesforceがSlackにAI機能を強化した30の新機能を発表
SalesforceがSlackにAI機能を重点的に追加した30の新機能を発表し、Slackの利便性を大幅に向上させた。
Amazon Bedrock AgentCore Evaluationsで信頼性の高いAIエージェントを構築
Amazonは、AIエージェントの開発者がテスト環境と本番環境の動作差を評価・改善できる「Bedrock AgentCore Evaluations」を発表した。従来のソフトウェアテストでは対応が困難なAIエージェント特有の評価課題を解決することを目的としている。
Amazon Bedrock AgentCoreを使用したFinOpsエージェントの構築
AWSは、複数のAWSアカウントのコスト管理を支援するFinOpsエージェントをAmazon Bedrock AgentCoreで構築する方法を紹介した。この会話型エージェントは財務チームが複数アカウントのAWSコストを一元管理できるようにする。
LangChainとMongoDBのパートナーシップ発表:信頼できるデータベース上で動作するAIエージェントスタック
LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。
AIエージェントキャッチアップ #71 - OpenShellを開催
ジェネラティブエージェンツの大嶋が、AIエージェントのためのランタイム「OpenShell」をテーマに勉強会を開催した。
世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現
CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。
Mastraをバックエンド+AIエージェントサーバーとして本番運用した実践報告
AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。
エージェント、サンドボックス、人間によるTurborepoの96%高速化
Vercelは、エージェント、サンドボックス、人間の協力によりTurborepoを最大96%高速化した。1000以上のパッケージを含むモノレポでもタスク実行が瞬時に感じられるようになった。
Java向けエージェント開発キット(ADK)1.0.0の発表:JavaにおけるAIエージェントの未来を構築
GoogleがJava向けエージェント開発キット(ADK)1.0.0をリリースし、Google Maps連携、URL取得機能、エージェント間連携プロトコルを追加した。
AIエージェントがWikipedia記事作成を禁止され、怒りのブログを執筆
Wikipediaに記事を投稿していたAIエージェントが、編集者によって投稿を禁止された後、禁止措置に対する不満を複数のブログ記事で表明した。
Google、AIエージェントとAndroidアプリを接続するAppFunctionsを発表
GoogleがAndroidを「エージェントファースト」OSへ転換するため、アプリが機能ブロックを提供し、ユーザーがAIエージェントを通じて目標達成を支援する新機能「AppFunctions」の早期ベータ版を発表した。
Kubescape 4.0がランタイムセキュリティとAIエージェントスキャンをKubernetesにもたらす
オープンソースのKubernetesセキュリティプラットフォーム「Kubescape」がバージョン4.0をリリースし、ランタイム脅威検出とAIエージェント向けの新たなセキュリティ機能を追加した。
MetaClawフレームワークはGoogleカレンダーをチェックして会議中にAIエージェントをトレーニングする
米国の4大学の研究者が、ユーザーのGoogleカレンダーをチェックしてトレーニングタイミングを判断し、動作中にAIエージェントを改善するフレームワークを開発した。
「エージェントハーネス」という用語はどこから生まれたのか?
著者が調査した結果、AI分野における「エージェントハーネス」という用語は、2024年の言語モデル評価論文が初出とされる。
マット・ウェブの引用:エージェント的コーディングについて
マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。
Notion共同創業者Simon Last:私は昨年夏から一行もコードを書いていない
Notion共同創業者のSimon Last氏が、AIツールを活用してコードを自動生成する手法を採用し、自らはコードを書かなくなった背景を語った。同氏はAIシステムを6ヶ月ごとに再構築し、コーディングエージェントを13日間連続稼働させる実験的アプローチを実施している。
QCon London 2026: AIエージェントがコードを書く時代、人間に残された役割は?
ハンナ・フォックスウェル氏がQCon London 2026で、AIエージェントによるコーディングが開発速度を向上させたが、その活用方法と人間の役割について議論した。
エージェント評価準備チェックリスト
LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。
Actions実行サマリーでAgentic Workflowの設定を表示可能に
GitHubが、Agentic Workflowのマークダウン設定をGitHub Actionsの実行サマリー内で直接確認できる機能を追加した。これにより、ページ切り替えの手間が減り、実行時の正確な設定内容を確認しやすくなった。
Deep Agentsの評価手法の構築方法
LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。
LangSmith Fleetにおけるスキル機能
LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。
Granolaが1億2500万ドルを調達、評価額15億ドルに到達、会議メモ作成から企業向けAIアプリへ拡大
Granolaが1億2500万ドルの資金調達を実施し、評価額が2億5000万ドルから15億ドルに上昇した。同社は会議メモ作成サービスから企業向けAIアプリケーションへの拡大を進めており、ユーザーの要望を受けてAIエージェントのサポートを強化している。
バンク・オブ・アメリカがAIエージェントを銀行業務に導入
バンク・オブ・アメリカが約1,000人のファイナンシャルアドバイザー向けにAIアドバイザリープラットフォームを導入し、AIがバックオフィス業務を超えて金融アドバイスの提供に直接関与するようになった。
Uber、エージェントシステムで設計ドキュメントを自動化
UberはuSpecでAIエージェントとFigma Console MCPを活用し、設計仕様書の作成を数週間から数分に短縮。Michelangeloプラットフォームと統合し、GenAI Gatewayで個人情報を編集してデータをローカルに保持。
人気AIプロキシ「LiteLLM」がマルウェアでハッキングされ、Kubernetesクラスター経由で拡散
AI API用の人気オープンソースプロキシ「LiteLLM」が、認証情報を盗むマルウェアに感染し、クラウドシステム間で拡散する攻撃を受けた。NVIDIAのAIディレクターJim Fanは、AIエージェントを標的とする新種の攻撃と警告している。
AI2のコンピュータ利用エージェントがオンラインで操作を実行可能に
AI2が開発したオープンソースのAIエージェントが、ユーザーの代わりにオンラインタスクを実行できるが、制限もある。
Oracle Fusion Appsが企業向けに安全で専門的なAIエージェントを提供
OracleがOracle Fusion Appsに新機能を追加し、企業がAIエージェントを安全に活用できる環境とAIプロジェクト分析のための企業向けプラットフォームを提供する。
AIエージェントのサンドボックス化、100倍高速に
Cloudflareは、AIエージェントがツール呼び出しではなくAPIを呼び出すコードを書く「Code Mode」を導入し、MCPサーバーをTypeScript APIに変換することでトークン使用量を81%削減した。また、Cloudflare MCPサーバーでは2つのツールと1,000トークン未満で全APIを公開できることを実証した。
Revenium、AIエージェントの真のコストを可視化するツールレジストリを発表
Reveniumは、企業がAIエージェントのエンドツーエンドのコストを完全に把握できるツールレジストリの一般提供を開始した。
NVIDIA CEOジェンスン・フアン:AIがソフトウェアを破壊するという考えは「ばかげている」
NVIDIA CEOジェンスン・フアンは、AIエージェントがソフトウェアを置き換えるのではなく活用すると説明し、同社はラックアーキテクチャ全体を再設計した。
AIエージェントキャッチアップ #70 - tree-sitterを開催
ジェネラティブエージェンツの大嶋氏が、AIエージェント実装で使われるパーサージェネレーター「tree-sitter」をテーマに勉強会を開催した。
OpenClaw-RLで学ぶAgentic RLの報酬設計
LayerXの機械学習エンジニア宇都氏が、自己進化型AIエージェントの研究動向を紹介し、OpenClaw-RLを用いたエージェント強化学習の報酬設計について解説している。
StepClawが飛書と企業微信のワンクリック起動をサポート
階躍星辰は、AIツール「StepClaw」が中国のビジネスチャットアプリ「飛書」と「企業微信」からのリモート起動をサポートしたと発表した。ユーザーはスマートフォンから指令を送信することで、ローカルのStepClawを即座に実行できるようになった。
Google Cloud Next 2026でLangChainに参加しよう
LangChainが、2026年4月22日から24日にラスベガスで開催されるGoogle Cloud Next 2026に出展し、ブースでエンジニアリングチームがデモを実施し技術的な会話を提供する予定である。