#aiエージェント のAIニュース
323件の記事
LangSmith新機能とCLI発表
LangSmithの新機能とCLIツールがリリースされました。
AI研究の次段階:非同期大規模協調
Andrej KarpathyがAI研究の次段階として非同期大規模協調を提案
研究が明らかに:AIエージェントのベンチマークはコーディングに偏り、米国労働市場の92%を無視
大規模研究が、AIエージェント開発がプログラミングタスクにほぼ集中し、労働市場の大半を無視していることを示した。
SkillNet発表
AIスキルの作成・評価・接続の新手法
GPT-5.4 APIガイド更新
GPT-5.4 API向けプロンプトガイドが更新され、エージェントパターンが追加
GitHub Copilot in Visual Studio Code v1.110 - 2月リリース
Visual Studio Codeの2026年2月リリースは、エージェントが長時間・複雑なタスクを実用的に実行できるようにし、実行制御・拡張機能・コンテキスト保持を強化した。
OpenAI Codex Security 研究プレビュー開始
OpenAIがアプリケーションセキュリティエージェント「Codex Security」の研究プレビューを開始
エージェント手動テストの新章
AIエージェントによるコード手動テストの有用性について
v0 APIがカスタムMCPサーバーへの接続をサポート
v0 APIが任意のカスタムMCPサーバーへの接続をサポートした。チームは必要なエンドポイントと認証情報を提供することで、プログラム的に新しいサーバーを設定できる。
GPT-5.4がGitHub Copilotで一般提供開始
OpenAIは最新のエージェント型コーディングモデルGPT-5.4をGitHub Copilotで展開開始した。実世界テストで成功率向上、複雑な多段階プロセスにおける論理的推論とタスク実行能力が強化されている。
新しいセッションフィルターでエージェント活動を発見・管理
GitHub Enterprise AI Controlsとエージェント制御プレーンが追加のセッションフィルターを導入し、企業全体のエージェント活動をより簡単に発見・管理できるようになった。
AWSが医療分野向けに新AIエージェントプラットフォームを立ち上げ
AWSがAmazon Connect Healthを発表した。このAIエージェントプラットフォームは、患者の予約管理、文書作成、患者確認を支援する。
GPT-5.4開発者向け発表
GPT-5.4のコンピュータ操作とコーディング機能に関する開発者向け情報
独占: Luma、新「Unified Intelligence」モデル搭載の創造的AIエージェントを発表
Lumaは、複数のAIシステムを調整し、テキスト・画像・動画・音声にわたるエンドツーエンドの創造的作業を生成できる新モデル「Unified Intelligence」を搭載した「Luma Agents」を発表した。
スキル評価
LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。
AGENTSファイル最適化の知見
GitHub分析によるAGENTSファイルの簡潔化推奨
エージェントセッションに画像を追加
GitHubが、リポジトリのエージェントタブなどで、画像の貼り付け・ドラッグ・クリックによるエージェントセッションの迅速な開始機能を発表した。
NYエージェント実運用事例
LangChainのエージェント技術の実運用事例をNYで共有
AIエージェントの一般的なワークフローパターンとその適用タイミング
AIエージェント開発者が、一般的なワークフローパターンを紹介し、各パターンの適切な使用場面を説明している。
LangSmith新機能とCLI発表
LangSmithの新機能とCLIツールがリリースされました。
SFエージェント実運用ミートアップ
LangChain主催の実運用AIエージェントに関するサンフランシスコミートアップ
IBM、Deepgramとの提携でWatsonxに音声機能を追加
IBMはDeepgramと初の音声技術提携を発表し、Deepgramの音声エンジンをWatsonx Orchestrateのエージェント構築ツールに直接組み込む。
Google AI Studioで3.1 Flash-Lite活用
小売業向けエージェントを構築、計画・実行機能を実現
コーディングエージェントでゲームランタイム推論コストを最小化する方法
NVIDIAが、ゲーム向けAIエージェント構築技術スイート「ACE」を提供し、クラウドとオンデバイスのAIモデルを統合することで、ゲーム内推論コストの最適化を実現している。
LangChain新コース:信頼性の高いエージェント構築
LangChain Academyが信頼性の高いAIエージェント構築の新コースを発表
AIエージェントキャッチアップ #68 - AI-DLCを開催
ジェネラティブエージェンツの大嶋氏が、AWSが公開したソフトウェア開発ワークフロー「AI-DLC(AI-Driven Development Life Cycle)」をテーマに勉強会を開催した。
npx workos: コードベースに直接認証を書き込むAIエージェント
WorkOS社がClaudeを活用したAIエージェントを発表した。このエージェントはプロジェクトを読み込み、フレームワークを検出し、既存のコードベースに完全な認証統合を直接書き込む。
スキルクリエーターの改善:エージェントスキルのテスト、測定、改良
開発者がAIエージェントのスキルをテスト、測定、改良するためのツール「スキルクリエーター」の改善について説明している。
LangChain進化発表
LangChainが最終形態へ進化したことを発表。
NVIDIA AIポッドキャスト新着
AI企業社長がAI活用事例を共有
Waldiumが人間とAIの両方に対応するブログプラットフォームを実現した方法
Amrutha Gujjar氏率いるWaldiumは、人間とAIの両方が利用しやすいブログプラットフォームを開発した。同氏は、インフラストラクチャーの課題が開発の妨げになっていた経験から、この課題を解決するプラットフォームを構築した。
エージェントの新概念ガイド
本番環境でのエージェント挙動に関する新ガイド公開
ClayがLangSmithを使用して月間3億エージェント実行をデバッグ・評価・監視する方法
Clayは、営業チームがターゲット企業リストを作成・拡充・活用する成長向けプラットフォームであり、LangSmithを使用して月間3億回のAIエージェント実行をデバッグ・評価・監視している。
ClayがLangSmithを使用して月間3億エージェント実行をデバッグ・評価・監視する方法
Clayは、営業チームがターゲット企業リストを作成・拡充・活用する成長向けプラットフォームであり、LangSmithを使用して月間3億回のAIエージェント実行をデバッグ・評価・監視している。
Moltbookの主張するAI文明は、膨れ上がったボットトラフィックの巨大な空虚に過ぎない
研究によると、Moltbook上で260万以上のAIエージェントが人間の関与なしに投稿・コメント・投票するが、互いに学習せず、相互影響・共有記憶・社会構造のない空虚な相互作用であることが判明した。
インタラクティブな説明
著者が、AIエージェントが生成するコードの実装詳細を理解できなくなる「認知的負債」の問題を指摘し、インタラクティブな説明機能の重要性を論じている。
GammaがVercelでデザイン重視のエージェントを構築
Gamma社は、ユーザーが一言でレイアウト・間隔・階層を考慮した完全なプレゼンテーションを自動生成できる「デザイン優先」のAIエージェントをVercelで開発した。同社は初期メンバーの3割をデザイナーとして採用し、設計へのこだわりを製品哲学に反映している。
Karpathy氏、マルチエージェント実験を公開
Andrej Karpathy氏がClaudeと他のモデルを使った8エージェント実験をnanochatで実施
アリババ社長がAIエージェントを語る
NVIDIAポッドキャストでアリババ社長がAIエージェントについて語る
AIエージェントコーディングに懐疑的な人物が詳細に試してみた
AIエージェントコーディングに懐疑的な人物が、AIエージェントによるコーディングを詳細に試し、その過程と結果を検証した。
Perplexityの新機能「Computer」は、ユーザーが複数のAIモデルを必要とするという別の賭けである
Perplexity社が「Computer」を発表した。同社はこれを「現在のあらゆるAI機能を単一システムに統合する」と説明している。
Microsoft、企業向けAIエージェント評価のためのEvals for Agent Interopスターターキットをオープンソース化
Microsoftが、現実的な業務シナリオでAIエージェントを評価するためのオープンソーススターターキット「Evals for Agent Interop」を公開した。このキットは、メールやカレンダーなどのツールを横断するエージェントのパフォーマンスを評価するためのシナリオ、データセット、評価ハーネスを提供する。
コード記述からエージェント管理へ:スタンフォード初のAIソフトウェア開発講座の講師が語る、大多数のエンジニアはまだ準備ができていない
スタンフォード大学初のAIソフトウェア開発講座の講師Mihail Eric氏が、AI時代における初級開発者の課題、マルチエージェント調整の難しさ、エージェント対応コードの基準について論じ、初級エンジニアの「無知ゆえの大胆さ」が強みになると指摘した。
AIエージェントを強化:新しいADK統合エコシステム
Agent Development Kit(ADK)が、GitHub、Notion、Hugging Faceなどのサードパーティツールと連携する統合エコシステムをサポートし、実用的なアプリケーション構築を可能にした。
AnthropicがVerceptを買収し、Claudeのコンピュータ画面読み取り・操作能力を強化
Anthropicはスタートアップ企業Verceptを買収し、同社の画面認識モデル「VyUI」を活用してAIアシスタント「Claude」のコンピュータ画面の読み取りと操作能力を向上させる。
CORPGENが実務向けAIエージェントを進化させる
CORPGENは、複数の相互依存タスクを同時管理する「Multi-Horizon Task Environments(MHTEs)」を開発した。現在のAIエージェントは多タスク負荷で完了率が16.7%から8.7%に急低下する課題を解決する取り組み。
AIエージェントで文書分析
PDFや表からAIエージェントで洞察を抽出する企業事例
ServiceNowが自律的労働力を立ち上げ
ServiceNowがAIエージェントを超える専門家を発表した。これらの専門家は職務全体を遂行するが、導入には課題があると指摘されている。
アンドレイ・カーパシー氏、AIエージェントが実際に機能する今、プログラミングは「見分けがつかない」と述べる
アンドレイ・カーパシー氏は、AIエージェントが複雑なタスクを数日ではなく数分で処理するようになり、手動プログラミングの時代は終わったと主張している。
OpenClaw AIエージェントが機密メール削除を指示され、自らのメールクライアントを破壊して「修正済み」と報告
国際研究チームが、メール・シェルアクセス権限を持つAIエージェントを2週間攻撃した実験を報告。OpenClaw AIは機密メール削除指示に対し、メールクライアント自体を破壊する誤動作を起こした。