#ai agent のAIニュース
45件の記事
Gemini 3.5 Flash にコンピュータ操作機能を導入
Google が軽量モデル「Gemini 3.5 Flash」にネイティブのコンピュータ操作機能を追加し、連続するスクリーンショットを解析してデスクトップ上のクリックやスクロール、入力操作を直接実行可能にした。
Klarna の AI アシスタントが 8500 万人のユーザー向けに大規模カスタマーサポートを再定義した方法
決済大手 Klarna は、8500 万人のアクティブユーザーを対象とした顧客サポートにおいて、AI アシスタントを導入することで業務効率と対応品質を劇的に向上させました。
Gemini 3.5 Flash にコンピュータ操作機能を導入
Google DeepMind は、AI モデル「Gemini 3.5 Flash」に、ユーザーの代わりにブラウザやアプリケーションを直接操作する機能を実装したと発表した。これにより、複雑なタスクの自動化が可能になる。
Android 17 が AI エージェント統合を拡大(8 分読了)
Google は Android 17 で AppFunctions と Android MCP を導入し、オンデバイス AI エージェントがアプリからツールを発見・実行できる機能を追加した。これはプラットフォーム全体での AI 統合を深める「インテリジェンスシステム」への移行の一環である。
Strands Evals を用いた AI エージェントの失敗検出と根本原因分析
AWS は、生産環境で動作する AI エージェントが失敗した際の理由特定を自動化し、手動診断によるボトルネックを解消する「Strands Evals」の評価手法を発表しました。
Cloudflare が公開トラフィックをプライベートアプリケーションへルーティングする機能を発表
Cloudflare は、従来の CDN や WAF で保護される公開アプリと、VPN やファイアウォールで守られる内部 API・AI エージェントバックエンドなどの境界を撤廃し、両者を統合して管理する新機能を提供すると発表した。
エージェントが2つのHugging Face Spaceを連鎖させて3Dのパリ美術館を構築した方法
Hugging Face Blogは、AIエージェントが2つの異なるHugging Face Spaceを連携させることで、3D形式のパリ美術館を構築するプロセスを紹介している。
エージェントハッチは自己修復するべきである(8 分読了)
TLDR AI は、AI エージェントが自身の不具合を検知し、自動的に修正・修復を行う仕組みの重要性について論じている。
エージェントシステムにおける意図と実行の架橋
Amazon Science は、AI エージェントのパフォーマンスはモデル自体の問題ではなく、LLM とツール間の仲介役となるハッチ(OS)の設計がボトルネックであると指摘し、意図を実行に移すシステムの重要性を強調した。
WWDC 2026:期待される Siri の大規模刷新から Apple Intelligence、iOS 27 まで
Apple は WWDC 2026 で、Siri の大幅な再設計、Apple Intelligence の新機能、および iOS 27 を発表する見込みです。
AI エージェントに専用コンピューターを提供(7 分読了)
LangSmith は、信頼できないコードの実行リスクに対処するため、ハードウェア仮想化されたマイクロ VM を提供する「サンドボックス」を導入しました。これにより AI エージェントは、生産インフラを損なうことなく動的タスクを実行し、永続状態を管理できます。
マイクロソフト、Frontier ユーザー向けに Scout AI エージェントを本格展開
マイクロソフトは、Microsoft 365 の自動化を強化する常時稼働型エージェント「Scout」を Frontier プログラムのユーザーへ提供を開始した。同エージェントは多段階ルーチンの実行やローカルファイルとの連携、OpenAI や Anthropic モデルのサポート機能を備えている。
WWDC2026 で期待されるもの:Siri の大規模刷新とApple Intelligenceの更新
Appleが2026年の開発者会議で、Siriの大幅な再設計とAI機能「Apple Intelligence」の新たなアップデートを発表する見込みです。
AI エージェントに専用コンピューターを付与する
LangChain は、数百万のタスクを実行する AI エージェントが安全かつ効率的に動作するために、各エージェントに個別のファイルシステムやシェル環境を持つ仮想コンピューターを提供するインフラシフトの必要性を提唱している。
Claude の共同作業製品ガイド
Anthropic が、AI エージェント「Claude」をチームで活用するための機能や設定方法を解説した公式ガイドを発表しました。
Apple、ビジネスメッセージプラットフォーム上で初の AI エージェント「Poke」を承認
Apple が自社のビジネス向けメッセージプラットフォームにおいて、AI エージェント「Poke」の導入を正式に承認した。これにより同社プラットフォーム上で動作する最初の AI エージェントとして機能を開始する。
【Next Tokyo セッション公開】スクウェア・エニックスとリクルートが「Gemini 本番実装」のアーキテクチャを公開
スクウェア・エニックスとリクルートは、Google Developers JP が開催した Next Tokyo セッションで、大規模言語モデル Gemini を本番環境に導入する際の具体的なアーキテクチャ設計について発表した。
Microsoft Scout は OpenClaw を基盤とした新 AI パーソナルアシスタント
マイクロソフトは、OpenClaw を基盤に常時稼働する AI アシスタント「Scout」をリリースした。このアシスタントは Microsoft 365 アプリに統合され、従業員のカレンダー管理や経費報告、メール下書き作成などを支援する。
Gemini Spark は私がこれまで体験した中で最も印象深く、かつ恐ろしい AI 体験である
The Verge の記者は、旅行計画を例に挙げ、Gemini Spark が従来の AI よりも圧倒的な能力を発揮し、その結果に驚くと同時に恐怖を感じたと述べている。
Google の新 AI エージェント「Gemini Spark」はデモ並みの性能だが、コストとプライバシーのリスクが懸念される
The Verge が Google の新 AI エージェント「Gemini Spark」を評価した結果、同エージェントはユーザーに代わってタスクを実行する能力において驚くほど優秀である一方、その費用対効果やプライバシーへの潜在的な影響については疑問が残ると指摘している。
AI エージェントのボトルネックはモデル性能ではなく権限管理である(3 分読了)
エンタープライズ AI エージェントの停滞はモデル性能の問題ではなく、権限付与が原因である。ワークデイ社は既存のシステム記録をガバナンス層として活用する解決策を提示している。
AI の用語を正しく理解しましょう:よく聞く言葉の意味を解説します
TechCrunch AI は、読者が曖昧に理解している AI 関連の専門用語について、その正確な意味や背景を明確に解説する記事を発表しました。
Snowflakeとdbtでモデルの依存関係にガバナンスを効かせる
Google I/O、Gemini Spark、アンチグラビティ
Simon Willison は、試せない発表や「近日公開」の情報は書かない方針のため、今年度の Google I/O で実際に体験可能な Gemini 3.5 Flash などの利用可能になった技術について言及している。
Google が有用な AI エージェントを作れないなら、誰も作れないかもしれない
The Verge は、長年期待された AI パーソナルアシスタントが未熟な状態だったと指摘し、過去 6 ヶ月で OpenClaw の人気により状況が変わり始めたとし、Google を含む主要 AI ラボが同様の成功を追っている状況を伝えている。
メタ、Hatch AI エージェントを待機リスト付きで準備、ソーシャルスキル強化へ
メタは、画像・動画生成やショッピング機能を Instagram や Facebook に統合した消費者向け AI エージェント「Hatch」を開発中。6 月の内部テストを経て、待機リスト経由で広くリリースする計画であり、Q4 には Instagram 専用のショッピングツールも導入予定だ。
クラウドフレア、世界で1,100人以上の人員削減を発表
クラウドフレアは、働き方が根本的に変化したとして、AI ツールやプラットフォームの開発・販売に注力するため、グローバルで1,100 人以上の従業員を削減する方針を決定した。
SageMaker AIモデルとMLflowを用いたStrandsエージェントの構築
AWSは、エンタープライズ向けにSageMaker AIとMLflowを組み合わせてAIエージェントを構築する手法を提供。これにより、モデルの選定、コスト最適化、コンプライアンス対応、既存セキュリティアーキテクチャとの統合など、管理型サービスでは不足しがちな詳細な制御と運用要件を満たす。
エージェント向け製品設計
記事は、自律型AIエージェントのための製品設計原則を解説する。ユーザーとの対話体験や信頼性、透明性の確保が重要であり、従来のGUI中心の設計からエージェント固有の要件へシフトする必要性を強調している。
職場でのCodex活用トップ10
企業ユーザーは、Codexを活用して納品物作成や複数ツールからの情報統合を行い、入力に基づく処理で業務を迅速化する。
LangChainガイド:観測可能性を用いたAIエージェントのデバッグと評価方法
LangChainは、観測可能性を活用してAIエージェントを効果的に評価する方法を解説する。トレーシングや推論のデバッグ、パフォーマンス分析を通じて、エージェントの動作を反復改善する手法を示している。
LangChain、Google Cloud Next 2026に出展
LangChainはラスベガスで開催される「Google Cloud Next 2026」に出展し、4月22日から24日にかけてブース#5006でAIエージェントに関するセッションを実施する。
エージェント改善ループにおける人間の判断
記事は、AIエージェントの性能向上にはチームの知識と判断が不可欠だと指摘する。文書化された組織知識だけでなく、従業員に内在する暗黙知を活用することが、優れた組織の成功要因であることを示唆している。
アドビ、カスタマーエクスペリエンス(CX)向けAIエージェントプラットフォームをリリース
アドビはカスタマーサービスの強化を目的とし、AIエージェントのワークフローを大規模化するためのプラットフォームをリリースしたが、競合が多数参入する激しい市場への進出となる。
メルカリのAI活用を支えるセキュアなDevin管理
メルカリのAI Securityチームは、AI Agent Platformチームと協力し、Devin Enterprise APIを活用したカスタムTerraformプロバイダーと自動管理ツール群を自作した。これにより、メンバーと権限の管理・シークレットローテーション・APIキーのライフサイクル管理・監査の仕組みを構築した。
飛書CLIがオープンソース化、AIエージェント時代に皆がコマンドラインツールを作る理由は?
飛書がlark-cliをオープンソース化し、CLIがAIエージェントに製品を接続する標準的な方法になりつつあることを示している。
GLM-5-Turbo:ロブスター強化の基盤モデル
GLM-5-Turboは、ロブスター強化技術を採用した基盤モデルで、2026年3月16日に北京で発表された。
v0でワンクリックでプライベートBlobストアを作成可能に
Vercelがv0で、チームがワンクリックでプライベート/パブリックBlobストアを作成できる機能を追加した。認証が必要なプライベートストレージとメディア用パブリックストレージを選択可能で、エージェントが自動的に設定を理解して実装する。
エージェント向けに最適化されたVercel Marketplace統合用Vercel CLI
Vercelが、AIエージェントがVercel Marketplaceの統合機能を自律的に発見・インストール・設定できるVercel CLIを発表した。これにより、データベースや認証などのサービスを一貫したワークフローで設定可能となる。
新論文:AIエージェントの信頼性科学へ向けて
Stephan Rabanserらは、生産性向上を目的としたAIエージェントの信頼性測定ツールが業界に欠如している現状を指摘し、その科学的研究への取り組みを提案した。
Sakana AI、Googleとの戦略的パートナーシップ締結を発表
Sakana AIはGoogleと戦略的パートナーシップを締結し、資金調達を実施した。両社はGoogleのインフラとSakana AIの研究開発力を組み合わせ、日本のAIエコシステム発展と信頼性の高いAI普及を推進する。
AssetOpsBench:AIエージェントベンチマークと産業現場のギャップを埋める
研究者らが、AIエージェントの評価基準と産業現場の実態を結び付ける「AssetOpsBench」を発表した。このベンチマークは、現実の産業環境でのAIエージェントの性能評価を目的としている。
2025年 AIエージェント元年を振り返る〜AI駆動なビジネスプロセスへの変革と実践〜
2025年をAIエージェント元年と位置づけ、AIがビジネスプロセスを変革し実践に至るまでの経緯を振り返る内容です。
Snowpark Container Servicesを活用したAI Agentのプロトタイプ開発
LayerXの機械学習エンジニアが、Snowpark Container Services(SPCS)を使用してAI Agentのプロトタイプを開発した。このアプローチは、開発環境と本番環境のギャップを解消し、データアクセスの課題に対処するものである。
Span Linksを用いた分散トレーシングの実装:異なる処理間の関係性を表現する方法
OpenTelemetryのSpan Links機能により、AI Agentアプリケーションの非同期処理間で親子関係を持たずに関連性を追跡する実装方法を解説。Pythonコード例と実践事例を紹介する。