誰でもエージェントを構築できるが、実行にはプラットフォームが必要
Vercelは、AIエージェントの構築が民主化された現在、競争優位性は迅速な構築能力ではなく、本番環境での信頼性高い運用を可能にするプラットフォームにあると主張し、自社のエージェントオーケストレーションプラットフォームを紹介している。
キーポイント
AIエージェント構築の民主化と運用の課題
AIモデルの進化により誰でも高度なエージェントを短時間で構築できるようになったが、本番環境での運用にはセキュリティ、監視、信頼性、コスト最適化などの専門知識が必要で、これが大きな障壁となっている。
競争優位性の源泉の変化
企業の競争優位性は、エージェントを「構築できるか」から、「ビジネス課題を解決するAIを迅速に反復し、スケールで確実に運用できるか」に移行している。
内部AIスタックの必要性
外部製品インフラと同様に堅牢な内部AIスタックが必要であり、エージェントワークロードの独自の要求に対応できる単一プラットフォームが求められている。
Vercelプラットフォームによる運用複雑性の抽象化
Vercelは、Sandboxes、Fluid compute、AI Gatewayなどの組み込みプリミティブにより、通常は数ヶ月のエンジニアリング努力を要する運用上の複雑さを自動的に処理するプラットフォームを提供している。
Vercel平台为智能体提供基础设施
Vercel提供专门为智能体工作负载设计的基础设施原语,包括安全沙箱、工作流编排和AI SDK,使开发者能够专注于构建智能体,而平台负责运行和管理。
智能体应用的多样化和规模化
通过使用统一的平台,Vercel内部运行了多种智能体(如数据分析、客户支持、内容生成等),并将相同技术用于产品(如v0代码生成智能体),实现了智能体的快速构建和规模化部署。
安全隔离与自动化执行机制
Vercel沙箱为智能体提供安全的隔离环境,执行文件探索、SQL生成和查询等敏感操作,防止恶意代码逃逸,同时工作流自动处理失败重试和状态恢复,确保可靠性。
影響分析・編集コメントを表示
影響分析
この記事は、生成AIの実用段階において、単なるモデルやエージェントの構築ツールから、それらを本番環境で確実に運用・管理するための「プラットフォーム」の重要性が急浮上していることを示している。これは、AI導入の次のフェーズとして、運用(Ops)のインフラ整備が競争の焦点になることを意味する。
編集コメント
Vercelの自社製品紹介という側面はあるが、AIエージェントの本番運用という業界全体が直面する現実的な課題を的確に指摘しており、実務家にとって重要な視点を提供している。
プロトタイピングは民主化されたが、本番デプロイはそうではない。
AIモデルによってコードとエージェント生成が一般化し、誰もが数分で高度なソフトウェアを構築できるようになった。朝のコーヒーが冷めないうちに、Claudeは完全に機能するエージェントの土台を作成できる。しかし、その同じAIは、システムが月500ドルで効率的に稼働できる場合でも、喜んで月5,000ドルのDevOps環境を設計してしまう。
誰もが内部ツールやエージェントを構築できる世界では、自社開発か購入かの採算計算が根本的に変わった。競争優位性は、構築できるかどうかではなくなった。それは、ビジネスの現実的な問題を解決するAIの迅速な反復と、さらに重要なことに、それらのシステムを大規模に確実に運用することから生まれる。
そのためには、企業は外部の製品インフラと同様に堅牢な内部AIスタックが必要だ。それがまさにVercelのエージェントオーケストレーションプラットフォームが提供するものである。
自社開発か購入かのROIが根本的に変わった
何十年もの間、カスタム内部ツールの経済合理性は大規模企業でのみ成立した。初期のエンジニアリング投資は高額だったが、真のコストは高いSLAと測定可能なROIを伴う長期的な運用だった。他のすべての企業にとっては、既製ソフトウェアの購入が現実的な選択肢だった。
AIはこの計算を根本的に変えた。あらゆる規模の企業が今や迅速にエージェントを作成できるようになり、カスタマイズが専門的なワークフローに即座にROIをもたらす:
OpenAIは分析を民主化するため内部データエージェントをデプロイした
Vercelのリード選定エージェントは1人のSDRが10人分の業務を可能にする(テンプレートはこちら)
Stripeは顧客向け財務影響計算機を構築した(飛行機の中で!)
今日、問いは自社開発か購入かではない。答えは「構築し、運用する」ことだ。内部システムとベンダーを分離する代わりに、企業はエージェントワークロードの独自の要求に対応できる単一プラットフォームを必要としている。
あらゆる企業に内部AIスタックが必要だ
内部アプリとエージェントのユースケースは爆発的に増えているが、問題がある:本番運用は依然として難しい。
Vibe codingは史上最大のシャドーIT問題の一つを生み出し、本番運用を理解するには、セキュリティ、オブザーバビリティ、信頼性、コスト最適化に関する専門知識が必要だ。構築が容易になる一方で、これらのスキルは依然として希少である。
エージェントにとっての究極の課題は、それらを構築することではなく、それらが稼働するプラットフォームである。
プラットフォームが製品だ:当社のデータエージェントがVercel上でどのように稼働するか
OpenAIと同様に、私たちはd0という独自の内部データエージェントを構築した(OSSテンプレートはこちら)。その中核はtext-to-SQLエンジンであり、これは新しい概念ではない。それを成功した製品にしたのは、その下にあるプラットフォームだった。
Vercelの組み込みプリミティブとデプロイメントインフラを使用して、一人の担当者が20%の時間を数週間かけてd0を構築した。
これが可能だったのは、Sandboxes、Fluid compute、AI Gatewayが、通常なら数ヶ月のエンジニアリング努力を要する運用の複雑さを自動的に処理したからだ。
今日、d0は以前は専門アナリストに限定されていたデータアクセスを完全に民主化した。エンジニア、マーケター、経営陣全員が自然言語で質問し、データウェアハウスから即座に正確な回答を得られる。
仕組みは以下の通り:
ユーザーがSlackで質問する:「前四半期のエンタープライズARRはいくらでしたか?」 d0はメッセージを受信し、ユーザーの権限に基づいて適切なデータアクセスレベルを決定し、エージェントワークフローを開始する。
エージェントはセマンティックレイヤーを探索する:このセマンティックレイヤーは、データウェアハウス、メトリクス、製品、運用を記述するYAMLベースの設定ファイル5層からなるファイルシステムである。
AI SDKがモデル呼び出しを処理する:ストリーミング応答、ツール使用、構造化出力はすべてそのまま動作する。私たちはカスタムのLLM基盤を構築せず、あらゆるVercel開発者が利用できる同じ抽象化を使用した。
エージェントのステップは耐久性を持ってオーケストレーションされる:ステップが失敗した場合(Snowflakeタイムアウト、モデルの不具合)、Vercel Workflowsが自動的に再試行と状態回復を処理する。
自動化されたアクションは分離して実行される:ファイル探索、SQL生成、クエリ実行はすべて安全なVercel Sandbox内で行われる。暴走した操作は外部に出られず、エージェントは高度な分析のために任意のPythonコードを実行できる。
複数のモデルを使用してコストと精度のバランスを取る:AI Gatewayは、単純なリクエストを高速なモデルに、複雑な分析をClaude Opusにルーティングし、すべて一つのコードベースで行う。
回答がSlackに届く:フォーマットされた結果(多くの場合、チャートやGoogle Sheetリンク付き)が、AI SDK Chatbotプリミティブを使用してSlackに返送される。
Vercelはエージェントのためのプラットフォームである
Vercelは、内部向けと顧客向けの両方のエージェントワークロードのために特別に構築されたインフラプリミティブを提供する。あなたがエージェントを構築し、Vercelがそれを実行する。そしてそれはそのまま動作する。
自社のエージェントオーケストレーションプラットフォームを使用することで、私たちは増え続けるカスタムエージェントを構築・管理できるようになった。
内部的に、私たちは以下を実行している:
リード選定エージェント
分析エージェントであるd0
カスタマーサポートエージェント(初期質問の87%を処理)
リスクのあるコンテンツにフラグを立てる不正利用検出エージェント
Slackスレッドを下書きブログ記事に変えるコンテンツエージェント
製品側では:
v0はコード生成エージェントであり、
Vercel Agentはプルリクエストをレビューし、インシデントを分析し、アクションを推奨する。
両製品は、内部ツールと同じプリミティブ上で稼働する。
Sandboxesは、エージェントに機密性の高い自律アクションを実行するための安全で分離された環境を提供する。これはコアシステムを保護するために重要だ。エージェントがテストされていないコードを生成・実行したり、プロンプトインジェクション攻撃に直面したりした場合、Sandboxesは損害を分離されたLinux VM内に封じ込める。エージェントが情報発見のためにファイルシステムアクセスを必要とする場合、Sandboxesは適切なリソースへの安全なアクセス権を持つVMを動的にマウントできる。
Fluid computeは、エージェントが生み出す予測不可能で長時間実行されるコンピュートパターンを自動的に処理する。エージェントがテキストを処理しているときはコンピュートを無視しやすいが、使用量が拡大し、ファイル、画像、ビデオのためのデータ集約的なワークロードを追加すると、コストはすぐに問題になる。Fluid computeは需要に基づいて自動的にスケールアップ・ダウンし、コンピュート時間に対してのみ課金されるため、コストを低く予測可能に保つ。
AI Gatewayは、組み込みの予算管理、使用状況監視、プロバイダー間の負荷分散を備えた、数百のモデルへの統一されたアクセスを提供する。これはベンダーロックインを回避し、最新モデルに即座にアクセスするために重要だ。エージェントが異なる種類のクエリを処理する必要がある場合、AI Gatewayは単純なリクエストを高速で安価なモデルにルーティングしながら、複雑な分析をより高性能なモデルに送信できる。主要プロバイダーがレート制限に達したりダウンしたりした場合、トラフィックは自動的にバックアッププロバイダーにフェイルオーバーする。
Workflowsは、エージェントに複雑で多段階の操作を確実に実行する能力を与える。エージェントが重要なビジネスプロセスに使用される場合、失敗はコストがかかる。耐久性のあるオーケストレーションは、各ステップで再試行ロジックとエラー処理を提供するため、中断が手動介入や操作全体の再起動を必要としない。
Observabilityは、基本的なシステムメトリクスを超えて、エージェントが実際に何をしているかを明らかにする。このデータは、予期しない動作のデバッグやエージェントパフォーマンスの最適化に不可欠だ。エージェントが予期しない決定を下したり、予想より多くのトークンを消費したり、パフォーマンスが低下したりした場合、オブザーバビリティは正確なプロンプト、モデル応答、決定パスを示し、特定のモデル呼び出しやデータソースまで問題を追跡できるようにする。
あなたのエージェントを構築し、Vercelがそれを実行する
将来、すべての企業が自社版のd0を構築するだろう。そして自社の内部コードレビューエージェントを。そして自社のカスタマーサポートルーティングエージェントを。そして何百もの他の専門ツールを。
これらのエージェントの成功は、それらを実行するプラットフォームに依存する。今すぐ内部AIスタックに投資する企業は、より速く動けるだけでなく、その優位性が時間とともに複利で増大するため、はるかに高いROIを実現するだろう。
原文を表示
Prototyping is democratized, but production deployment isn't.
AI models have commoditized code and agent generation, making it possible for anyone to build sophisticated software in minutes. Claude can scaffold a fully functional agent before your morning coffee gets cold. But that same AI will happily architect a $5,000/month DevOps setup when the system could run efficiently at $500/month.
In a world where anyone can build internal tools and agents, the build vs. buy equation has fundamentally changed. Competitive advantage no longer comes from whether you can build. It comes from rapid iteration on AI that solves real problems for your business and, more importantly, reliably operating those systems at scale.
To do that, companies need an internal AI stack as robust as their external product infrastructure. That's exactly what Vercel's agent orchestration platform provides.
Build vs. buy ROI has fundamentally changed
For decades, the economics of custom internal tools only made sense at large-scale companies. The upfront engineering investment was high, but the real cost was long-term operation with high SLAs and measurable ROI. For everyone else, buying off-the-shelf software was the practical option.
AI has fundamentally changed this equation. Companies of any size can now create agents quickly, and customization delivers immediate ROI for specialized workflows:
OpenAI deployed an internal data agent to democratize analytics
Vercel’s lead qualification agent helps one SDR do the work of 10 (template here)
Stripe built a customer-facing financial impact calculator (on a flight!)
Today the question isn’t build vs. buy. The answer is build and run. Instead of separating internal systems and vendors, companies need a single platform that can handle the unique demands of agent workloads.
Every company needs an internal AI stack
The number of use cases for internal apps and agents is exploding, but here's the problem: production is still hard.
Vibe coding has created one of the largest shadow IT problems in history, and understanding production operations requires expertise in security, observability, reliability, and cost optimization. These skills remain rare even as building becomes easier.
The ultimate challenge for agents isn't building them, it's the platform they run on.
The platform is the product: how our data agent runs on Vercel
Like OpenAI, we built our own internal data agent named d0 (OSS template here). At its core, d0 is a text-to-SQL engine, which is not a new concept. What made it a successful product was the platform underneath.
Using Vercel’s built-in primitives and deployment infrastructure, one person built d0 in a few weeks using 20% of their time.
This was only possible because Sandboxes, Fluid compute and AI Gateway automatically handled the operational complexity that would have normally taken months of engineering effort to scaffold and secure.
Today, d0 has completely democratized data access that was previously limited to professional analysts. Engineers, marketers, and executives can all ask questions in natural language and get immediate, accurate answers from our data warehouse.
Here’s how it works:
A user asks a question in Slack: "What was our Enterprise ARR last quarter?" d0 receives the message, determines the right level of data access based on the permissions of the user, and starts the agent workflow.
The agent explores a semantic layer: The semantic layer is a file system of 5 layers of YAML-based configs that describe our data warehouse, our metrics, our products, and our operations.
AI SDK handles the model calls: Streaming responses, tool use, and structured outputs all work out of the box. We didn't build custom LLM plumbing, we used the same abstractions any Vercel developer can use.
Agent steps are orchestrated durably: If a step fails (Snowflake timeout, model hiccup), Vercel Workflows handles retries and state recovery automatically.
Automated actions are executed in isolation: File exploration, SQL generation, and query execution all happen in a secure Vercel Sandbox. Runaway operations can't escape, and the agent can execute arbitrary Python for advanced analysis.
Multiple models are used to balance cost and accuracy: AI Gateway routes simple requests to fast models and complex analysis to Claude Opus, all in one code base.
The answer arrives in Slack: formatted results, often with a chart or Google Sheet link, are delivered back to the Slack using the AI SDK Chatbot primitive.
Vercel is the platform for agents
Vercel provides the infrastructure primitives purpose-built for agent workloads, both internal and customer-facing. You build the agent, Vercel runs it. And it just works.
Using our own agent orchestration platform has enabled us to build and manage an increasing number of custom agents.
Internally, we run:
A lead qualification agent
d0, our analytics agent
A customer support agent (handles 87% percent of initial questions)
An abuse detection agent that flags risky content
A content agent that turns Slack threads into draft blog posts.
On the product side:
v0 is a code generation agent, and
Vercel Agent can review pull requests, analyze incidents, and recommend actions.
Both products run on the same primitives as our internal tools.
Sandboxes give agents a secure, isolated environment for executing sensitive autonomous actions. This is critical for protecting your core systems. When agents generate and run untested code or face prompt injection attacks, sandboxes contain the damage within isolated Linux VMs. When agents need filesystem access for information discovery, sandboxes can dynamically mount VMs with secure access to the right resources.
Fluid compute automatically handles the unpredictable, long-running compute patterns that agents create. It’s easy to ignore compute when agents are processing text, but when usage scales and you add data-heavy workloads for files, images, and video, cost becomes an issue quickly. Fluid compute automatically scales up and down based on demand, and you're only charged for compute time, keeping costs low and predictable.
AI Gateway gives you unified access to hundreds of models with built-in budget control, usage monitoring, and load balancing across providers. This is important for avoiding vendor lock-in and getting instant access to the latest models. When your agent needs to handle different types of queries, AI Gateway can route simple requests to fast, inexpensive models while sending complex analysis to more capable ones. If your primary provider hits rate limits or goes down, traffic automatically fails over to backup providers.
Workflows give agents the ability to perform complex, multi-step operations reliably. When agents are used for critical business processes, failures are costly. Durable orchestration provides retry logic and error handling at every step so that interruptions don't require manual intervention or restart the entire operation.
Observability reveals what agents are actually doing beyond basic system metrics. This data is essential for debugging unexpected behavior and optimizing agent performance. When your agent makes unexpected decisions, consumes more tokens than expected, or underperforms, observability shows you the exact prompts, model responses, and decision paths, letting you trace issues back to specific model calls or data sources.
Build your agents, Vercel will run them
In the future, every enterprise will build their version of d0. And their internal code review agent. And their customer support routing agent. And hundreds of other specialized tools.
The success of these agents depends on the platform that runs them. Companies who invest in their internal AI stack now will not only move faster, they'll experience far higher ROI as their advantages compound over time.
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み