#aiエージェント のAIニュース

325件の記事

AIエージェントの評価を解明する

AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。

Anthropic Engineering·1月9日·★★★★

動的コンテキスト発見

OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。

Cursor Blog·1月6日

Super AI Agent と呼んでみる

ABEJAの村主CTO室が、Claude CodeやCodexなどの既存AIツールを「Super AI Agent」と定義し、AIエージェントという用語の乱用に対する見解を示した。

ABEJA Tech Blog·12月19日

スキルとMCPサーバーによるClaudeの能力拡張

Anthropicが、スキルとModel Context Protocol(MCP)サーバーを導入し、AIアシスタントClaudeの機能を拡張することを発表した。これにより、Claudeが外部ツールやデータソースと連携して、より複雑なタスクを実行できるようになる。

Claude Blog·12月19日·★★★★

Windsurf 1.12.44

Windsurfがバージョン1.12.44をリリースし、「プロンプトが長すぎる」エラーの発生を減らし、MCP OAuth設定でスコープが指定されていない場合にすべてのサポート対象スコープを要求する機能を改善した。

Windsurf Changelog·12月12日

AIエージェントキャッチアップ #60 - Microsoft Agent Frameworkを開催

ジェネラティブエージェンツが、Semantic KernelやAutoGenのアイデアを拡張したMicrosoft Agent Frameworkについての勉強会を開催した。

Generative Agents·12月8日

AIエージェントキャッチアップ #59 - W&B Weave を開催しました

ジェネラティブエージェンツの大嶋が、LLMアプリケーションのトレースや評価機能を持つ「W&B Weave」についての勉強会を開催した。

Generative Agents·12月1日

AIエージェントキャッチアップ #58 - Playwright Test Agentsを開催

ジェネラティブエージェンツの大嶋氏が、Playwrightに導入されたエージェント機能「Playwright Test Agents」についての勉強会を開催した。

Generative Agents·11月26日

長時間実行エージェントのための効果的なハーネス

多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。

Anthropic Engineering·11月26日·★★★★

Claude開発者プラットフォームにおける高度なツール使用機能の導入

Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。

Anthropic Engineering·11月24日·★★★★

プロジェクトフェッチ

フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。

Anthropic Red Team·11月12日·★★★★

AIエージェントキャッチアップ #55 - Agent Lightningを開催

ジェネラティブエージェンツの大嶋氏が、マイクロソフトが開発したAIエージェント育成ツール「Agent Lightning」をテーマにした勉強会を開催した。

Generative Agents·11月5日

OpenAIが営利目的で再編、MiniMax-M2がオープンコーディングを牽引、ユニバーサルミュージックグループがAIを採用、LLMがプライベート化

AIエージェントが企業内の多様なデータを分析しパターンを発見する能力が向上しているが、データサイロの問題が深刻化している。OpenAIは営利目的で再編し、MiniMax-M2はオープンコーディングを主導、ユニバーサルミュージックグループはAIを積極採用、LLMはプライベート化が進んでいる。

The Batch·11月5日

MCPによるコード実行:より効率的なエージェントの構築

直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。

Anthropic Engineering·11月4日·★★★★

AIエージェントキャッチアップ #54 - Agentic Commerce Protocol を開催

ジェネラティブエージェンツの大嶋が、ChatGPTの商品購入機能で使用されている「Agentic Commerce Protocol」についての勉強会を開催した。

Generative Agents·10月31日

新トレンド:並列AIエージェントを起動するプログラミング

Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。

Pragmatic Engineer·10月31日·★★★★

SWE-1.5の紹介:高速なエージェントモデル

開発者がSWE-1.5を発表した。同モデルは最先端に近いコーディング性能を前例のない速度で提供する。

Windsurf Blog·10月29日

AIエージェントキャッチアップ #53 - Claude Agent SDK を開催

ジェネラティブエージェンツの大嶋氏が、Claude Code上で強力なエージェントを構築するツールコレクション「Claude Agent SDK」についての勉強会を開催した。

Generative Agents·10月21日

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

エージェントによるエージェントのための効果的なツール作成

エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。

Anthropic Engineering·9月11日·★★★★

Expo最新情報!クラウドとAIの未来を探求しよう

Google Cloud Next 2025 Tokyoイベントで、GoogleがクラウドとAI技術の最新動向を発表し、開発者向けの新機能やツールを紹介した。

Google Developers JP·5月15日

LLMでJSON出力する際に気をつけていること3選

Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。

Algomatic Tech Blog·5月8日

【Next Tokyo】待望のプログラム公開!ビジネスと技術の未来を掴もう!

Next Tokyoがビジネスと技術の未来に関するプログラムを公開した。

Google Developers JP·4月17日

ツールサポート

OllamaがLlama 3.1などの人気モデルでツール呼び出しをサポートした。これにより、モデルは既知のツールを使用してプロンプトに応答し、より複雑なタスクの実行や外部との相互作用が可能になる。

Ollama Blog·7月25日

社会的学習:大規模言語モデルを用いた協調学習

Google Researchの研究者らが、複数の大規模言語モデルが協力して学習し、単一モデルよりも優れた性能を発揮する「社会的学習」手法を発表した。

Google Research Blog·3月8日·★★★★