#aiエージェント のAIニュース

381件の記事

AIエージェントキャッチアップ #63 - A2UIを開催

AIエージェントとユーザー間のインターフェース「A2UI」についての勉強会を開催し、その概要と関連リソースを紹介しました。

Generative Agents·1月13日

Windsurf バージョン1.13.6のリリース:エージェント機能と安定性向上

開発ツール「Windsurf」がバージョン1.13.6を公開し、Cascade でのエージェントスキルサポートを開始した。また、バグ修正とパフォーマンス改善により、システムの安定性と信頼性が向上した。

Windsurf Changelog·1月12日

AIエージェントの評価を解明する

AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。

Anthropic Engineering·1月9日·★★★★

LWiAIポッドキャスト #230 - 2025年振り返り、NvidiaがGroqを買収、GLM 4.7、METR

NvidiaがAIチップスタートアップGroqを約200億ドルで買収。MetaもAIスタートアップManusを買収し、Z.AIはGLM-4.7を発表。

Last Week in AI·1月7日·★★★★★

動的コンテキスト発見

OpenAIは、AIエージェントが自ら関連コンテキストを引き出す能力向上を目指し、事前に提供する詳細を減らすアプローチの有効性を報告した。

Cursor Blog·1月6日

Super AI Agent と呼んでみる

ABEJAの村主CTO室が、Claude CodeやCodexなどの既存AIツールを「Super AI Agent」と定義し、AIエージェントという用語の乱用に対する見解を示した。

ABEJA Tech Blog·12月19日

スキルとMCPサーバーによるClaudeの能力拡張

Anthropicが、スキルとModel Context Protocol(MCP)サーバーを導入し、AIアシスタントClaudeの機能を拡張することを発表した。これにより、Claudeが外部ツールやデータソースと連携して、より複雑なタスクを実行できるようになる。

Claude Blog·12月19日·★★★★

Windsurf バージョン 1.12.44 のパッチと改善点

開発者チームは、Windsurf の新バージョン 1.12.44 をリリースし、プロンプトが長すぎるエラーの発生頻度を減らし、MCP OAuth 設定でスコープ未指定時に全サポート範囲を要求する機能を追加した。

Windsurf Changelog·12月12日

AIエージェントキャッチアップ #60 - Microsoft Agent Frameworkを開催

ジェネラティブエージェンツが、Semantic KernelやAutoGenのアイデアを拡張したMicrosoft Agent Frameworkについての勉強会を開催した。

Generative Agents·12月8日

AIエージェントキャッチアップ #59 - W&B Weave を開催しました

ジェネラティブエージェンツの大嶋が、LLMアプリケーションのトレースや評価機能を持つ「W&B Weave」についての勉強会を開催した。

Generative Agents·12月1日

AIエージェントキャッチアップ #58 - Playwright Test Agentsを開催

ジェネラティブエージェンツの大嶋氏が、Playwrightに導入されたエージェント機能「Playwright Test Agents」についての勉強会を開催した。

Generative Agents·11月26日

長時間実行エージェントのための効果的なハーネス

多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。

Anthropic Engineering·11月26日·★★★★

Claude開発者プラットフォームにおける高度なツール使用機能の導入

Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。

Anthropic Engineering·11月24日·★★★★

Grok 4.1 FastとAgent Tools API

xAI社が次世代ツール呼び出しエージェントをAPIに導入し、Grok 4.1 FastとAgent Tools APIを発表した。

xAI News·11月19日

プロジェクトフェッチ

フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。

Anthropic Red Team·11月12日·★★★★

AIエージェントキャッチアップ #55 - Agent Lightningを開催

ジェネラティブエージェンツの大嶋氏が、マイクロソフトが開発したAIエージェント育成ツール「Agent Lightning」をテーマにした勉強会を開催した。

Generative Agents·11月5日

OpenAIが営利目的で再編、MiniMax-M2がオープンコーディングを牽引、ユニバーサルミュージックグループがAIを採用、LLMがプライベート化

AIエージェントが企業内の多様なデータを分析しパターンを発見する能力が向上しているが、データサイロの問題が深刻化している。OpenAIは営利目的で再編し、MiniMax-M2はオープンコーディングを主導、ユニバーサルミュージックグループはAIを積極採用、LLMはプライベート化が進んでいる。

The Batch·11月5日

MCPによるコード実行:より効率的なエージェントの構築

直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。

Anthropic Engineering·11月4日·★★★★

AIエージェントキャッチアップ #54 - Agentic Commerce Protocol を開催

ジェネラティブエージェンツの大嶋が、ChatGPTの商品購入機能で使用されている「Agentic Commerce Protocol」についての勉強会を開催した。

Generative Agents·10月31日

新トレンド:並列AIエージェントを起動するプログラミング

Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。

Pragmatic Engineer·10月31日·★★★★

SWE-1.5の紹介:高速なエージェントモデル

開発者がSWE-1.5を発表した。同モデルは最先端に近いコーディング性能を前例のない速度で提供する。

Windsurf Blog·10月29日

AIエージェントキャッチアップ #53 - Claude Agent SDK を開催

ジェネラティブエージェンツの大嶋氏が、Claude Code上で強力なエージェントを構築するツールコレクション「Claude Agent SDK」についての勉強会を開催した。

Generative Agents·10月21日

AIエージェントを支える技術:コンテキストエンジニアリングの現状

大規模言語モデルを用いたAIエージェント構築に不可欠なコンテキストエンジニアリングについて、2025年時点での知見をまとめた記事。

Algomatic Tech Blog·10月15日·★★★★

DeepSeekが推論コスト削減、OpenAIがAMDと連携強化、Thinking Machinesがファインチューニング簡素化、ロボットが空間認識向上

DeepSeekがAI推論コストを削減し、OpenAIがAMDと協力関係を強化した。Thinking Machinesがファインチューニングプロセスを簡素化し、ロボットが空間認識能力を向上させた。

The Batch·10月15日

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

エージェントによるエージェントのための効果的なツール作成

エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。

Anthropic Engineering·9月11日·★★★★

Expo最新情報!クラウドとAIの未来を探求しよう

Google Cloud Next 2025 Tokyoイベントで、GoogleがクラウドとAI技術の最新動向を発表し、開発者向けの新機能やツールを紹介した。

Google Developers JP·5月15日

LLMでJSON出力する際に気をつけていること3選

Algomatic ネオセールスカンパニーの末國氏が、営業AIエージェント「アポドリ」の開発経験から、LLMアプリケーションにおけるJSON出力制御のコツを3つ紹介している。

Algomatic Tech Blog·5月8日

【Next Tokyo】待望のプログラム公開!ビジネスと技術の未来を掴もう!

Next Tokyoがビジネスと技術の未来に関するプログラムを公開した。

Google Developers JP·4月17日

ツールサポート

OllamaがLlama 3.1などの人気モデルでツール呼び出しをサポートした。これにより、モデルは既知のツールを使用してプロンプトに応答し、より複雑なタスクの実行や外部との相互作用が可能になる。

Ollama Blog·7月25日

社会的学習:大規模言語モデルを用いた協調学習

Google Researchの研究者らが、複数の大規模言語モデルが協力して学習し、単一モデルよりも優れた性能を発揮する「社会的学習」手法を発表した。

Google Research Blog·3月8日·★★★★