#aiエージェント のAIニュース
325件の記事
AIエージェントの評価を解明する
AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。
動的コンテキスト発見
OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。
Super AI Agent と呼んでみる
ABEJAの村主CTO室が、Claude CodeやCodexなどの既存AIツールを「Super AI Agent」と定義し、AIエージェントという用語の乱用に対する見解を示した。
スキルとMCPサーバーによるClaudeの能力拡張
Anthropicが、スキルとModel Context Protocol(MCP)サーバーを導入し、AIアシスタントClaudeの機能を拡張することを発表した。これにより、Claudeが外部ツールやデータソースと連携して、より複雑なタスクを実行できるようになる。
Windsurf 1.12.44
Windsurfがバージョン1.12.44をリリースし、「プロンプトが長すぎる」エラーの発生を減らし、MCP OAuth設定でスコープが指定されていない場合にすべてのサポート対象スコープを要求する機能を改善した。
AIエージェントキャッチアップ #60 - Microsoft Agent Frameworkを開催
ジェネラティブエージェンツが、Semantic KernelやAutoGenのアイデアを拡張したMicrosoft Agent Frameworkについての勉強会を開催した。
AIエージェントキャッチアップ #59 - W&B Weave を開催しました
ジェネラティブエージェンツの大嶋が、LLMアプリケーションのトレースや評価機能を持つ「W&B Weave」についての勉強会を開催した。
AIエージェントキャッチアップ #58 - Playwright Test Agentsを開催
ジェネラティブエージェンツの大嶋氏が、Playwrightに導入されたエージェント機能「Playwright Test Agents」についての勉強会を開催した。
長時間実行エージェントのための効果的なハーネス
多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。
Claude開発者プラットフォームにおける高度なツール使用機能の導入
Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。
プロジェクトフェッチ
フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。
AIエージェントキャッチアップ #55 - Agent Lightningを開催
ジェネラティブエージェンツの大嶋氏が、マイクロソフトが開発したAIエージェント育成ツール「Agent Lightning」をテーマにした勉強会を開催した。
OpenAIが営利目的で再編、MiniMax-M2がオープンコーディングを牽引、ユニバーサルミュージックグループがAIを採用、LLMがプライベート化
AIエージェントが企業内の多様なデータを分析しパターンを発見する能力が向上しているが、データサイロの問題が深刻化している。OpenAIは営利目的で再編し、MiniMax-M2はオープンコーディングを主導、ユニバーサルミュージックグループはAIを積極採用、LLMはプライベート化が進んでいる。
MCPによるコード実行:より効率的なエージェントの構築
直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。
AIエージェントキャッチアップ #54 - Agentic Commerce Protocol を開催
ジェネラティブエージェンツの大嶋が、ChatGPTの商品購入機能で使用されている「Agentic Commerce Protocol」についての勉強会を開催した。
新トレンド:並列AIエージェントを起動するプログラミング
Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。
SWE-1.5の紹介:高速なエージェントモデル
開発者がSWE-1.5を発表した。同モデルは最先端に近いコーディング性能を前例のない速度で提供する。
AIエージェントキャッチアップ #53 - Claude Agent SDK を開催
ジェネラティブエージェンツの大嶋氏が、Claude Code上で強力なエージェントを構築するツールコレクション「Claude Agent SDK」についての勉強会を開催した。
AIエージェントのための効果的なコンテキスト設計
AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
Expo最新情報!クラウドとAIの未来を探求しよう
Google Cloud Next 2025 Tokyoイベントで、GoogleがクラウドとAI技術の最新動向を発表し、開発者向けの新機能やツールを紹介した。
LLMでJSON出力する際に気をつけていること3選
Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。
【Next Tokyo】待望のプログラム公開!ビジネスと技術の未来を掴もう!
Next Tokyoがビジネスと技術の未来に関するプログラムを公開した。
ツールサポート
OllamaがLlama 3.1などの人気モデルでツール呼び出しをサポートした。これにより、モデルは既知のツールを使用してプロンプトに応答し、より複雑なタスクの実行や外部との相互作用が可能になる。
社会的学習:大規模言語モデルを用いた協調学習
Google Researchの研究者らが、複数の大規模言語モデルが協力して学習し、単一モデルよりも優れた性能を発揮する「社会的学習」手法を発表した。