エージェントスタックの紹介
Vercel は、エージェント開発におけるベンダーロックインや複雑な実装課題を解決する「Agent Stack」を発表し、AI SDK と AI Gateway を中核とした生産環境対応の基盤を提供すると発表した。
キーポイント
エージェントの3 つのコア要件と課題
モデル接続・ルーティング、複雑なワークフロー実行、外部システム連携という 3 つの能力が不可欠だが、現状の開発者はベンダーロックインや手動統合のジレンマに直面している。
AI SDK と AI Gateway の役割
AI SDK はマルチモデル・マルチフレームワーク対応の統一インターフェースを提供し、AI Gateway はトークン利用の CDN としてコスト管理、フェイルオーバー、単一エンドポイントによるルーティングを実現する。
堅牢なワークフロー実行環境
Workflow SDK と Vercel Sandbox を組み合わせることで、ステップごとのチェックポイント保存、状態永続化、失敗時の自動リトライ、および安全なコード実行環境を提供し、エージェントの耐久性を担保する。
Workflow SDK の堅牢な状態管理
ジョブの各ステップを記録・保持し、失敗時に再試行または一時停止して、直前の成功した地点から再開する仕組みにより、長時間実行される処理でも状態を失わない。
Vercel Sandbox による安全なコード実行
各エージェントに独立したマイクロ VM を割り当てて完全隔離し、必要な権限のみを動的に付与することで、誤ったコマンドや悪意のあるコードがホスト環境に影響するリスクを防ぐ。
Vercel Connect と Chat SDK の統合
スコープ限定・短寿命のトークンによる監査可能なデータアクセスと、単一のコードベースで複数のチャネル(Slack, GitHub など)にエージェントを配信する機能により、安全かつ広範な運用が可能になる。
エージェントの形状とフレームワーク
過去1年間で構築した数百のエージェントから、エージェントには明確な「形状」があることが発見されました。
影響分析・編集コメントを表示
影響分析
この発表は、AI エージェントが研究段階から本番環境(Production)へ移行する際の最大の障壁であった「複雑なインフラ統合」と「運用上の信頼性」を解決する重要なステップです。開発者がプロバイダーに依存せず、柔軟かつ堅牢なエージェントを迅速に構築・展開できる環境を整えることで、AI エージェントの実装スピードと品質が大幅に向上すると期待されます。
編集コメント
Vercel が提供するこのスタックは、AI エージェント開発の「インフラコスト」を劇的に下げる可能性を秘めており、特に大規模なワークフローを扱う企業にとって即戦力となるツールセットです。
エージェントは、サポートチケットへの回答からコードの作成まで、ほぼあらゆる種類の業務を遂行するために設計されています。作業負荷がどれほど複雑であっても、実行時間が長くても、完了までに何ターン必要であっても、すべてのエージェントには動作に必要な 3 つのコア機能が必要です:
エージェントはモデルに接続し、それらの間でルーティングする必要があります
エージェントは多くのステップにわたるワークフローを実行する必要があります
エージェントは、自分たちを有用にするシステムや、人々が対話に使用するプラットフォームに接続する必要があります
これらの機能を実装して完全なエージェントを構築すると、開発者は単一プロバイダーの API によるベンダーロックイン、ソリューションをつなぎ合わせるか、あるいは独自に抽象化層を構築するかを選択せざるを得なくなります。
The Agent Stack は、本番環境で動作するグレードのエージェントを作成し、リリースするために必要なすべてのビルディングブロックを提供します。
モデルへの接続
エージェントは単一のモデル上で動作しません。タスクごとにコスト、レイテンシ、機能のトレードオフが異なり、適切な呼び出しはエージェントが何を行っているかによって異なります。どのモデルにもアクセスできる 1 つのインターフェースが必要であり、それらの間でルーティングする方法と、ユーザーへストリーミングで返す方法が必要です。
AI SDK は、エージェントにあらゆるモデルを呼び出すための 1 つのインターフェースを提供し、AI Gateway は単一のエンドポイントから数百ものモデル間をルーティングします。
AI SDK
各ラボは独自の API を通じてモデル呼び出しを公開しています。ストリーミング、ツール呼び出し、構造化出力、リクエストの形状などはすべて異なるため、サポートする各プロバイダーごとに、構築と維持のための別の統合が必要になります。
AI SDK は、AI アプリ、エージェント、およびフレームワークを構築するための単一のインターフェースです。プラットフォーム、フレームワーク、モデルに依存せず、テキスト、画像、音声、動画などを生成することができます。
AI Gateway
トークンは現在、ウェブにおける帯域幅と同様に生産上の依存関係であり、エージェントはタスクごとに異なるモデルを使用します。各研究所間の統合には、高価でレート制限がかかり、常に変化するプロバイダーからの個別のキーと請求が必要となります。
AI Gateway はトークンのための CDN として機能し、過去 10 年以上にわたって運用してきたグローバルネットワーク上でそれらをルーティングします。各呼び出しを単一のエンドポイント経由でルーティングし、プロバイダーがダウンした場合はフェイルオーバーを行い、すべてのプロバイダーにおけるコストと使用状況を追跡します。プロバイダーの価格に上乗せ料金を支払うことなく、ご自身のキーを使用することも可能です。
SERHANT は 1 つのキーから 3 つのモデルを実行し、市場分析を Claude に、マーケティングコピーを GPT に、画像生成を Gemini に送信します。
複雑なワークフローの実行
エージェントはタスクを順次処理するため、数分あるいは数時間かかることもあり、その際、安全な環境でコードやその他の操作を実行する必要があります。
Workflow SDK はエージェントのランを永続化し、Vercel Sandbox(サンドボックス)によりエージェントに個別の隔離された VM を提供します。
Workflow SDK
エージェントワークフローの深い段階でステップが失敗し、再開できる状態がない場合、ジョブ全体が最初からやり直され、支払い済みのすべてのモデル呼び出しが再実行されます。永続性を解決するには、リトライ、ステート永続化、オーケストレーションを自ら構築・維持する必要があります。
Workflow SDK は、ジョブのすべてのステップをチェックポイントし、状態を保持し、失敗したものを再試行し、人の対応や低速な API、ウェブフックを待機する必要がある場合は一時停止します。ゼロからではなく、最後の正常なステップから再開して実行されます。
FLORA は、Workflow SDK を基盤としてクリエイティブエージェントを構築しました。これにより、単一のクリエイティブセッションが 50 以上の画像モデルに展開されます。各ステップは永続化され、失敗時に再試行されるため、長時間の実行でも状態が失われることはありません。
Vercel Sandbox
エージェントはファイルの読み取り、コマンドの実行、コードの記述を行います。この自由度こそが能力の源泉ですが、制約がなければリスクにもなります。コードはレビューされておらず、間違ったコマンドを実行する可能性もあり、一つの悪いステップで本来触れるべきではないリソースにアクセスしてしまう恐れがあります。
Vercel Sandbox は、各エージェントに独自のマイクロ VM を提供します。これはファイルシステムと Docker サポートを備え、ホストや他のすべてのサンドボックスから隔離された完全な Linux コンピュータです。認証情報は、エージェントのコードがサービス呼び出しを行った際にのみ注入されるため、必要なリソースを利用しながらも、生トークンを直接見ることはありません。
サンドボックスは、Vercel の 10 億件を超えるプレビューデプロイメントと毎日 600 万件のビルドを支える基盤を、あなたとあなたのエージェントに提供します。
データやツールへの接続
モデルとの対話のみを行うエージェントでは、できることは限られます。有用であるためには、データや外部システムへのアクセス、およびそれを利用する人々との通信が必要です。両方の接続は安全でなければなりません。
Vercel Connect は、エージェントに対してスコープ限定かつ短寿命のデータ・システムアクセス権を提供します。Chat SDK を使用することで、ユーザーがすでに利用しているアプリケーション内にエージェントを配置できます。
Vercel Connect
プルリクエストの作成、レコードの更新、データウェアハウスへのクエリ実行。エージェントにこれらの作業を行わせるということは、利用しているプラットフォームへのアクセス権を与えることを意味し、現状では通常、エージェントが将来行う可能性のあるあらゆる行為をカバーする広範な長期有効トークンが必要となります。このトークンは期限切れにならず、どのユーザーがどのアクションを許可したのかを特定できる者はいません。
Vercel Connect を利用すれば、各システムとの統合は一度で済みます。エージェントは各タスクごとに短期間のトークンを発行し、そのスコープは明示的に付与された権限のみに限定されます。
すべてのアクションはユーザーからエージェント、そしてサービスへと追跡可能であり、監査ログにより、エージェントが行動した対象となるユーザーとすべての呼び出しが紐付けられます。
Vercel Connect は、Agent Stack の最新構成要素です。現在は公開ベータ版として提供されており、Slack、GitHub、Snowflake、Salesforce、Notion、Linear に対応し、OAuth または API を通じて他のあらゆるサービスとも連携可能です。
Chat SDK
人々は一つのタブだけで作業しません。Slack、GitHub、Linear、WhatsApp、Discord の間を行き来しており、各場所でエージェントを利用することを期待しています。それぞれのプラットフォームで個別に実装する場合、API 統合、認証フロー、メッセージ形式がすべて異なってしまいます。
Chat SDK は、エージェントをすべてのプラットフォームへ配信します。Chat SDK を一度インストールするだけで、各プラットフォームのアダプター処理を担当し、ユーザーがすでに利用している場所でエージェントを利用可能にします。
NanoClaw は Chat SDK を活用し、単一のコードベースから 12 以上のチャネルにわたって一つのエージェントを配信しています。会話は Slack で始まり、GitHub や Linear で継続することもでき、エージェントは異なるプラットフォーム間でも文脈(コンテキスト)を維持します。
eve, the agent framework
過去1年間、私たちはAgent Stack上で数百のエージェントを構築してきました。これらのビルディングブロックを繰り返し組み立てる過程で、エージェントには特定の形状があることを学びました。
その形状こそが「eve」です。これはフレームワークとしての形であり、Agent Stackの意見のあるオープンソース実装を単一のディレクトリにまとめたものです。指示はMarkdownで記述し、ツールはTypeScriptで実装します。永続的な実行、サンドボックス化された計算、承認プロセス、そして配信機能は、その下のブロック上で動作するように既に組み込まれています。eveを使えば、アセンブリ作業は完了しているため、あなたはエージェントのみを記述すればよく、それ以外のことは気にする必要はありません。
eveは本日、パブリックベータ版として公開されています。詳細については、ローンチ記事をご覧ください。
続きを読む
原文を表示
Agents are designed to do almost any kind of work, from answering support tickets to writing code. No matter how complex the workload, how long it runs, or how many turns it takes to complete, every agent needs three core capabilities to operate:
Agents need to connect to models and route between them
Agents need to run workflows across many steps
Agents need to connect to the systems that make them useful and the platforms people use to interact with them
Implementing these capabilities to build a complete agent forces developers to choose between vendor lock-in with a single provider API, stitching together solutions, or building abstractions themselves.
The Agent Stack gives you all the building blocks you need to create and ship production-grade agents.
Connect to models
Agents don't run on a single model. Every task has a different cost, latency, and capability tradeoff, and the right call depends on what the agent is doing. It needs one interface to reach any of them, a way to route between them, and a way to stream back to the user.
AI SDK gives an agent one interface to call any model, and AI Gateway routes across hundreds of them from a single endpoint.
AI SDK
Every lab exposes model calls through their own API. Streaming, tool calls, structured output, and the shape of the request all vary, so every provider you support adds another integration to build and maintain.
AI SDK is a single interface for building AI apps, agents, and frameworks. It is platform, framework, and model agnostic, and allows you to generate text, images, speech, video, and more.
AI Gateway
Tokens are a production dependency now, the way bandwidth is for the web, and agents use different models per task. Integration across labs means separate keys and billing from providers that are expensive, rate-limited, and always changing.
AI Gateway is the CDN for tokens, routing them on the global network we have run for over a decade. It routes each call through a single endpoint, fails over when a provider goes down, and tracks cost and usage across all of them. You pay the provider's price with no markup, and you can use your own keys.
SERHANT. runs three models from a single key, sending market analysis to Claude, marketing copy to GPT, and image generation to Gemini.
Execute complex workflows
Agents work on tasks sequentially, sometimes for minutes or hours, and those tasks often require them execute code and other operations in a secure environment.
Workflow SDK makes agent runs durable, and Vercel Sandbox gives agents their own isolated VM.
Workflow SDK
When a step fails deep in an agent workflow and there's nothing to resume from, the whole job starts over, re-running every model call you paid for. Solving for durability means building and maintaining retries, state persistence, and orchestration yourself.
Workflow SDK checkpoints every step of every job, keeps state, retries what fails, and pauses when it needs to wait on a person, a slow API, or a webhook. Runs resume from the last good step, instead of from zero.
FLORA built its creative agent on Workflow SDK, where a single creative session fans out across more than fifty image models. Each step persists and retries on failure, so a long run never loses its state.
Vercel Sandbox
Agents read files, run commands, and write code. That freedom is what makes them capable. But without constraints, it's also a risk. The code is unreviewed, a command might be wrong, and one bad step can reach something it should never touch.
Vercel Sandbox gives each agent its own microVM, a full Linux computer with a filesystem, Docker support, and its own kernel, isolated from the host and from every other sandbox. Credentials are injected only when the agent's code calls a service, so it can use what it needs without ever seeing a raw token.
Sandboxes give you and your agents the same primitive behind Vercel's billion preview deployments and six million daily builds.
Connect to data and tools
An agent that only talks to models can't do much. To be useful, it has to access data and external systems, and communicate with the people using it. Both connections have to be secure.
Vercel Connect gives agents scoped, short-lived access to data and systems. Chat SDK ships agents into the apps where your users already are.
Vercel Connect
Opening a pull request, updating a record, querying a data warehouse. Asking an agent to do that work means giving it access to the platforms you use, and today that usually means a long-lived token broad enough to cover anything the agent might ever do. It never expires, and no one can say which user authorized what action the agent took.
With Vercel Connect, you integrate with each system once. The agent mints a short-lived token for each task, scoped only to the permissions you explicitly grant.
Every action traces from user to agent to service, so the audit log ties every call to the user the agent acted for.
Vercel Connect is the newest building block in the Agent Stack, in public beta with support for Slack, GitHub, Snowflake, Salesforce, Notion, and Linear, and any other service through OAuth or API.
Chat SDK
People don’t work in one tab. They move between Slack, GitHub, Linear, WhatsApp, and Discord, and they expect your agent in each one. Putting it there yourself means a different API integration, auth flow, and message format for every platform.
Chat SDK delivers your agent to all of them. You install Chat SDK once, and it handles each platform's adapter, making your agent available where your users already are.
NanoClaw uses Chat SDK to deliver one agent across more than a dozen channels from a single codebase. A conversation can start on Slack and continue in GitHub or Linear, and the agent keeps its context across surfaces.
eve, the agent framework
Over the last year we’ve built hundreds of agents on the Agent Stack. As we repeatedly assembled these building blocks, we learned that agents have a shape.
eve is that shape, as a framework. It’s an opinionated, open-source implementation of the Agent Stack in a single directory. Instructions live in markdown, tools in TypeScript. Durable execution, sandboxed compute, approvals, and delivery are already wired in underneath, running on the blocks above. With eve, the assembly is done, so you write the agent and nothing else.
eve is in public beta today, and you can learn more in the launch post.
Read more
関連記事
Chat SDK に AI SDK ツールセットが追加されました
Vercel は Chat SDK の新サブパス「chat/ai」を通じて、AI SDK ツールセットを標準搭載しました。これにより、エージェントへの読み書きアクションの接続が容易になり、デフォルトで承認が必要な機能やプリセットによるスコープ制御も実装されています。
各トークンからより多くを引き出す:Copilot のコンテキスト処理とモデルルーティングの改善方法
GitHub は、Copilot が計画やデバッグなど長期間にわたるエージェントタスクを遂行する際、トークンの使用効率を高めるため、コンテキストの重複削減と用途に応じた適切なモデル選択機能を強化した。
Cloudflare、エージェントハッチスとフレームワークの拡充へ、まずは「Flue」から
Cloudflare は、2026 年に本番環境でのエージェント活用が主流になるとして、モデルへの外部アクセスを制御するハッチスやフレームワークの提供を強化し、その第一弾として「Flue」を発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み