Vercel Ship 2026 レポート:エージェント向けインフラの未来を語る
Vercel は London で開催された Ship 2026 で、エージェント開発の標準基盤となる「Agent Stack」および新フレームワーク「eve」を発表し、AI エージェントの構築・デプロイ・運用におけるインフラのパラダイムシフトを宣言した。
キーポイント
Agentic Infrastructure の3大要素
Vercel は、コーディングエージェントがソフトウェアをデプロイする先、ユーザーが独自のエージェントを構築・運用するプラットフォーム、そして Vercel 自体がエージェントによって自動化されるという 3 つの側面からなる「エージェンティック・インフラストラクチャ」を定義した。
Agent Stack の完全なプリミティブ
AI SDK、AI Gateway、Workflow SDK、Vercel Sandbox、Chat SDK により、モデル接続、ワークフロー実行、外部システム連携というエージェントに必要な全機能を網羅するエンドツーエンドのビルディングブロックを提供する。
セキュリティ強化された Vercel Connect
環境変数への永続的なトークン保存を不要とし、タスクごとにスコープ限定された一時的な認証情報を発行することで、エージェントが外部システムに安全かつ動的に接続できる「Vercel Connect」を発表した。
新フレームワーク「eve」の公開
Vercel 内部で数百のエージェントを構築・運用する過程で見出した共通アーキテクチャをオープンソース化した「eve」が紹介され、エージェントを単一ディレクトリ内で数分で構築・実行・スケーリング可能にする。
Vercel Services とマイクロサービスの強化
7月1日より「Vercel Services」が正式にローンチされ、マイクロサービスがファーストクラスとして扱われるようになりました。これにより、フロントエンドとバックエンドを統合して開発・デプロイでき、かつ内部ネットワークのみで通信可能な環境が実現されます。
エンタープライズ向けセキュリティ機能の拡充
企業ユーザー向けの「Vercel for Enterprise Apps and Agents」が導入され、Enterprise Managed Users による中央管理や BYOC(Bring Your Own Cloud)機能が提供されます。これにより、社内アプリの隔離や自社 AWS テナント内での実行が可能となり、セキュリティチームへの証明も容易になります。
Vercel Agent の発表と新しい権限モデル
「Vercel Agent」がプライベートベータとして公開され、プロダクションの監視やアラーム調査を自律的に行い、修正を PR として提案するインテリジェンスレイヤーとなりました。また、一度に複数のアクションに必要な権限を一括で承認する新しいモデルにより、開発者と企業の双方にとって安全な運用が可能になります。
影響分析・編集コメントを表示
影響分析
この発表は、AI エージェントの開発が個別の実験段階から、企業レベルでの信頼性とスケーラビリティを前提とした本格的なインフラ競争へと移行したことを示す重要な転換点です。Vercel が提供する標準化されたスタックとセキュリティモデルが業界デファクトスタンダードになれば、開発者は基盤構築の負担から解放され、エージェントロジックの実装に集中できるようになるでしょう。
編集コメント
Vercel は単なるデプロイメントプラットフォームから、AI エージェントのライフサイクル全体を管理する「OS」へと進化しようとしています。特にセキュリティ面でのアプローチ(一時認証)と開発体験の簡素化(eve)は、実務レベルでのエージェント導入を加速させる鍵となるでしょう。
10 年にわたり、Vercel はウェブの構築方法を変えてきました。今、私たちはエージェントのためにも同じことを成し遂げようとしています。次の 10 年で勝つ企業は、最初からエージェント向けに設計されたインフラストラクチャ上で構築するでしょう。そして先週、ロンドンではそのために 2,500 人以上の人々が Vercel Ship 2026 に集まりました。
エージェンティック・インフラストラクチャ
Guillermo は Ship の開幕で、Vercel のビジョンを共有しました。それは、思考するソフトウェアを含むあらゆるものをデプロイできる、真のフルスタックプラットフォームです。
エージェンティック・インフラストラクチャには 3 つの部分があります:
Vercel はコーディングエージェントがソフトウェアをデプロイする場所です。Claude Code や Codex にどこにデプロイするかを尋ねると、Vercel が返されます。なぜなら Vercel はエージェントの動作方式のために構築されているからです。
Vercel は、あなたが自分自身でエージェントを構築しデプロイする場所です。私たちは、生産環境で安全かつ大規模にアプリやエージェントを構築・実行するために必要なすべてのツールを提供します。
Vercel 自体もエージェントによって自動化されています。Vercel は生産環境でのあなたのアプリを実行し、トラフィック、トレース、観測可能性(observability)、および異常に対応します。このデータは、私たちが持つエージェントに調査を自律的に行うために必要な文脈を与え、単なるアラートではなくプルリクエストを提示させます。
Vercel はエージェントのリリースのためのものです
次の基調講演で、Tom はエージェントスタック(Agent Stack)の各プリミティブについて説明しました。これはエージェント向けのエンドツーエンドなビルディングブロックセットです。Hedi は、エージェントが外部システムと安全に接続するための方法である Vercel Connect を紹介しました。そして Shar は、Vercel の新しいエージェントフレームワークである eve の完全なデモを行いました。eve は、エージェントスタックを数分で、単一のディレクトリ内で実装するものです。
エージェントスタック
どのようなワークロードであっても、すべてのエージェントはモデルに接続し、多数のステップにわたってワークフローを実行し、有用性を高めるシステムや人々と接続する必要があります。Vercel は、これら 3 つの機能を構築するために必要なすべてのプリミティブを提供します。
AI SDK(Software Development Kit)は、あらゆるプロバイダーでストリーミング、ツール呼び出し、構造化出力が同じように動作するように、任意のモデルを呼び出すための単一の API を提供します。
AI Gateway は、1 つのエンドポイントから数百ものモデルにリクエストをルーティングし、プロバイダーがダウンした際に自動フェイルオーバーを実行します。
Workflow SDK は、自動リトライ、状態永続化、組み込みの観測機能により、すべての実行を耐久性のあるものにします。
Vercel Sandbox は、各エージェントに孤立したマイクロ VM(仮想マシン)を提供し、本番環境への展開前に作成されたコードを実行・テストできるようにします。
Chat SDK を使用すれば、単一のコードベースから Slack、Discord、GitHub など across 多様なプラットフォームにエージェントをデプロイできます。
Vercel Connect
Vercel Connect は、ロンドンで開催された Ship 2026 で発表され、Agent Stack(エージェントスタック)における最新のビルディングブロックとなりました。
Connect は、環境変数に保存される長期有効なプロバイダートークンを必要とせず、エージェントが作業対象のツール、データ、サービスへの安全なアクセスを提供します。アプリまたはエージェントは、眼前の 1 つのタスクにスコープされた一時的な認証情報を要求するため、漏洩する可能性のある恒久的な秘密鍵は残されません。
eve
Vercel で数百ものエージェントを構築した結果、その基盤となるアーキテクチャには共通の形状があることに気づきました。eve は、その形状をオープンソースフレームワークとして実装したものであり、Vercel において生産環境のエージェントを構築・実行・スケールさせるための方法です。
エージェントは単一のディレクトリ内に存在し、指示は Markdown で、ツールは TypeScript で記述されます。永続的な実行、サンドボックス化された計算、承認機能、サブエージェント、評価機能などは既に組み込まれています。
Vercel はフルスタックアプリのリリースのためのプラットフォームです
Guillermo 氏はまた、追加のバックエンドフレームワーク、データベース、そしてマイクロサービスへのサポートを含む、フルスタックアプリケーションをホストする Vercel の能力についても強調しました。
バックエンドとデータベース
今年初め、Vercel は世界有数の Python 開発者を迎えてバックエンドワークロードに対するサポートを拡張しました。
現在、FastAPI、Flask、Express、Hono、およびその他のバックエンドフレームワークを Vercel でスケールして実行できます。
バックエンド専用サービスもサポートされており、REST API、永続的なワークフロー、キュー、cron ジョブ、MCP サーバーなどをホストすることが可能です。
Vercel マーケットプレイスでは、Amazon Aurora、Aurora DSQL、DynamoDB、OpenSearch などのデータベースに、Vercel ダッシュボードから直接アクセスできるようになりました。
Vercel サービス
Guillermo 氏は 7 月 1 日に利用開始となる Vercel Services の立ち上げを発表しました。Vercel Services により、マイクロサービスは Vercel 上でファーストクラス citizen となりました。フロントエンドとバックエンドを一緒に開発・デプロイでき、バックエンド専用の変更でもフルプレビュー環境でアプリがビルドされます。そして初めて、これらのサービスはパブリックインターネットを経由せずに相互に通信できるようになります。
Vercel はエンタープライズ向けのリリースプラットフォームです
私たちにとって、Next.js と eve はエージェントを構築する部分を容易にしました。難しい部分はそれを取り巻くすべてでした:アクセス権限、認証、統合、そしてセキュリティチームに対してその全てを実証することです。Jeanne は、私たちが自分たちのためにエンタープライズセキュリティプラットフォームを構築し、その後それを顧客のために利用可能にしたという物語を語りました。
Vercel for Enterprise Apps and Agents
Vercel for Enterprise Apps and Agents は、安全にデプロイするために必要なアイデンティティ、アクセス権限、ガバナンスを提供しながら、Vercel の開発者体験を会社内の全員に届けるものです。
Enterprise Managed Users(プライベートベータ)は、Vercel と v0 を使用できる人を中央管理し、完全な監査証跡を提供します。
Vercel Passport は、社内アプリを社内に留め、デフォルトで IdP の背後で非公開に保ちます。
Bring your own cloud (BYOC) on AWS(プライベートベータ)は、Vercel 関数を含む Vercel を独自の AWS テナントで実行する能力を提供します。
Vercel Agent
Malte は、Vercel でリリースするためのインテリジェンスレイヤーである Vercel Agent(プライベートベータ)を発表しました。eve と Agent Stack に基づいて構築され、本番環境のデプロイを監視し、アラートや異常を自律的に調査し、レビューと承認のために PR として修正を開きます。
Vercel Agent の独自型パーミッションモデルは、プランモードと権限付与を組み合わせることで、開発者および企業双方にとって安全に使用できるように設計されています。一つずつアクションの承認を求めるのではなく、Vercel Agent はタスク完了に必要な権限を事前に計画し、それらを単一の整合性のあるステップで承認を求めます。これは独自のアイデンティティとして実行され、デフォルトでは読み取り専用であり、本番環境にアクセスする前に狭義かつ一時的な権限の付与を要求します。
Ship 2026 in London
Ship week London
米国以外で初めて開催された Ship は、基調講演に至るまでの5日間のイベントと、1週間を通じて市内を巡ったアイスクリームトラックで構成されました。
Built in London hackathon
OpenAI とのコラボレーションによるハッカソンでは、200 人のビルダーが Codex および Vercel でエージェントを開発しました。その中で際立った3つのプロジェクトがあります。Stella はロンドンの中小企業向けに未請求の助成金を検索し、Oscar はモデルへの送信前にプロンプトを洗練させるコパイロットであり、Phone Jail は気晴らしを防ぎつつ、それでもスマホに手を伸ばした際にユーザーを叱咤する機能を持っています。
Media, Founder, VC, and CTO dinners
メディアディナーでは記者たちがストーリーのアイデアを交換しました。VC ディナーでは12人の創業者が EMEA 地域における AI の未来について議論しました。また、Marks & Spencer や Currys などのチームから集まった dozen の CTO が、企業内でエージェントを構築しスケールさせるために必要な要素について非公式に語り合いました。
Day Zero builder night
キーノート前日の「Day Zero」は、400 人のビルダーが集まるナイトイベントとなりました。エンタープライズチームである Mentimeter、Okta、MongoDB が Vercel と共に、パートナーの DeepMind、ElevenLabs、Cursor を加えた満員の会場に集結しました。
AI Social Club
Malte の「新しいソフトウェア時代の新たなスタック」という講演には 160 名の待機リストが形成され、その後は Guillermo と Deliveroo の Will Shu が「エージェント型エンタープライズの構築」について対談を行いました。
Ship day sessions
Anthropic の André Balleyguier は、Vercel 上の Claude Managed Agents を紹介しました。ここでは Anthropic がエージェントのループをホストしますが、エージェントが実行するすべてのコマンドは、あなたが所有する Vercel Sandbox(サンドボックス)内で実行されます。これにより、ファイルシステム、プロセス、ネットワーク出口(egress)がすべてあなたの環境内に保持されます。
Currys/Elkjøp の Tomas Jansson は、自チームが北欧の小売業者の e コマーススタックを 3 つのフェーズを経て storefronts(ストアフロント)からショッピングエージェントへと進化させた方法を披露しました。この変革は Next.js への移行によって裏打ちされ、ファーストバイトまでの時間を 40% 短縮することに成功しました。最終的な状態とは、ナビゲーションに代わって顧客の意図が中心となる世界です。
Vercel の Matan Kushner は、Vercel のサポートエージェントである Vertex が、コンテキストが拡大しても性能を低下させることなく、現在ではサポートチケットの 91% を自動化し、月間 5,000 時間のエンジニア時間を節約していることを解説しました。
Auth0 の Jas Sagoo と Sam Bellenは、エージェントを実環境に導入する上で重要なのはモデルの品質よりもアイデンティティであると主張しました。彼らは Vercel AI SDK 上で、トークン vault(Vault)、CIBA 承認、ファーストクラスプリンシパルとしてのエージェント、オンビハーフオブ委任という 4 つの標準ベースのアイデンティティパターンを実演し、すべてのアクションがスコープされ、共有 API キーではなく人間の意思決定に遡って追跡可能であることを示しました。
Vercel の Abhi Sivasailam は、eve を基盤として構築された Vercel 内部のデータエージェント d0 について詳しく解説しました。このエージェントはサンドボックス内で分析を実行し、現在では質問の 45% が人間からではなく他のエージェントから来るようになっています。
OpenAI の Romain Huet は、Vercel 上の Codex Cloud エージェントにタスク全体を委任することで開発者がより迅速にリリースできる方法をデモンストレーションしました。また、エージェントが製品のユーザーとなるにつれ、スコープ付き API キー、マークダウン形式のドキュメント、プラグインを活用して「エージェント体験」のために設計すべきであると主張しました。
Callstack の Michał Pierzchała は、実機上でモバイルアプリを実行し、独自のユーザーフローを探索し、すべての PR(プルリクエスト)に対してスクリーンショット、録画、ログを投稿する QA エージェントを実演しました。
ElevenLabs の Alex Holt は、ElevenLabs Speech Engine と AI SDK を組み合わせることで、1 秒未満で返信し、話している最中の中断にも対応し、会話中に言語を切り替えることができる音声エージェントを構築する方法を示しました。
Vercel の Malavika Balachandran Tadeusz は、ソフトウェアが自らリリースする仕組みについて解説しました。これは Vercel Flags や Skills といったプリミティブを活用して、開発からテスト、観測性(Observability)、実験へとエージェントループを拡張するものです。
パネル:本番環境におけるエージェント
Vercel の COO、ジャンヌ・グロサーが司会を務め、EU 有数の CTO やフロンティア研究所の AI リーダーらを招き、アジェンティックなワークロードをプロトタイプから本番環境へ移行する方法についてパネルディスカッションが行われました。いくつかの注目点をご紹介します。
アーサー・ヴィエガーズ(Cursor):自律性はリスクを追跡すべきであり、エージェントが変更のリスクを評価する能力が高ければ高いほど、より多くの作業を自律的に実行させることができます。Shopify と Amplitude ではすでに、開発者の時間を要さずに低リスクな PR の 60〜70% が自動レビュー・マージされていますが、認証に関する 2 行の変更でも依然として人間の確認が必要です。
アンドレ・バレーギエ(Anthropic):エージェントに何を実行させるかを決定するには、各アクションの「取り消しやすさ」と「影響範囲(ブラスト半径)」を評価基準とし、それに応じて制限を設ける必要があります。例えば、自己ホスト型のサンドボックス内に閉じ込めるなどです。自律性を高めるほど、安全性を保つためには観測性(オバザビリティ)と評価(evals)が不可欠となります。
ライアン・デン・ルイジェン(Currys):店舗の死は予測されたものの決して訪れず、Currys は人間に賭けることで市場をリードしています。アジェンティックなコマースにおける未解決の問いは、どのショッピング体験を顧客がエージェントに任せたいか、そしてどの部分を依然として人間の担当者に任せたいかという点です。
ニコラ・ル・パレック(AKQA):AI ネイティブな顧客体験では、ナビゲーションに代わって「意図」が中心となります。これを実現するには 3 つの層が必要です。真の顧客意図を捉える仕組み、AI システムが参照するためにブランドや製品データを蓄積する「ブランド・ブレイン」、そして静的ページを提供するのではなくその場でページを組み立てる生成型 UI です。
ハリー・ステビングズとの火曜夜談
その日は、Guillermo と 20VC の Harry Stebbings による火の玉チャット(fireside chat)で幕を閉じました。以下は、そのチャットの最後に行われたライトニングラウンドからの抜粋です。
Guillermo Rauch: 投資したい創業者にはどのような属性がありますか?
Harry Stebbings: プロフィールは完全に変わりました。かつては資金調達と顧客拡大ができるセールス主導の CEO で、人格と営業力が会社を牽引するタイプが求められていました。しかし今、私が求めているのはエンジニアリングとプロダクト主導の創業者です。
Guillermo Rauch: 誰にでも業界の声を発信できる能力を教えることはできますか?
Harry Stebbings: 可能です、ただし困難です。それを 6 ヶ月連続で行い続ける必要があります。これは鍛え上げる筋肉のようなものであり、毎日、毎時間コミットし続けなければなりません。
Guillermo Rauch: 誰でもコンテンツやソフトウェアを制作できる時代において、どうすれば目立つことができますか?
Harry Stebbings: 新しいフォーマット、新しいイントロダクション、物語を語る新たな方法、そして作品を形作る新しいアプローチを生み出すことです。コンテンツ自体も変化しています。かつてはリーダーシップや採用に関する番組を行っていましたが、もう誰も関心を持っていません。今受け入れられているのは「創業者」と「AI」です。これら 2 つが鍵となります。
次へ進むものを船出しよう
ロンドンで開催された Ship 2026 にご参加いただきありがとうございます。ベルリン、ニューヨーク市、シドニー、サンフランシスコでお会いしましょう。まだ登録されていない方は、チケットを入手する猶予があります。
続きを読む
原文を表示
For a decade, Vercel has shaped how the web gets built. Now, we’re doing the same for agents. The companies that win the next decade will build on infrastructure designed for agents from the start, and over 2,500 people gathered in London this week to do just that at Vercel Ship 2026.
Agentic infrastructure
Guillermo kicked off Ship by sharing his vision for Vercel: a true full-stack platform where you can deploy anything, including software that can think.
Agentic infrastructure has three parts:
Vercel is where coding agents deploy software. When you ask Claude Code or Codex where to deploy, you get Vercel, because Vercel is built for the way agents work.
Vercel is where you build and deploy your own agents. We give you every tool you need to build and run apps and agents in production, securely, at scale.
Vercel itself is automated by agents. Vercel runs your apps in production, handling traffic, traces, observability, and anomalies. That data gives our agents the context they need to investigate autonomously, and then surface pull requests, not just alerts.
Vercel is for shipping agents
In the next keynote, Tom walked through each primitive in the Agent Stack, an end-to-end set of building blocks for agents. Hedi introduced Vercel Connect, a secure way for agents to connect with external systems. And Shar gave a full demo of eve, Vercel's new agent framework that implements the Agent Stack in minutes, in a single directory.
The Agent Stack
No matter the workload, every agent needs to connect to models, run workflows across many steps, and connect to the systems and people that make it useful. Vercel gives you every primitive you need to build all three capabilities.
AI SDK gives you one API to call any model, so streaming, tool calls, and structured output work the same across every provider
AI Gateway routes your requests across hundreds of models from one endpoint, with automatic failover when a provider goes down
Workflow SDK makes every run durable with automatic retries, state persistence, and observability built in
Vercel Sandbox gives each agent an isolated microVM to run and test the code it writes before it ships to production
Chat SDK lets you deploy your agent across Slack, Discord, GitHub, and more from a single codebase
Vercel Connect
Vercel Connect launched at Ship 2026 in London as the newest building block in the Agent Stack.
Connect provides agents with secure access to the tools, data, and services they work with, without requiring a long-lived provider token stored in your environment variables. Your app or agent requests a temporary credential scoped to the one task in front of it, so there’s no standing secret left to leak.
eve
After building hundreds of agents at Vercel, we noticed that the architecture underneath had the same shape. eve is that shape as an open-source framework, and it's how we build, run, and scale production agents at Vercel.
eve Agents live in a single directory, with instructions in markdown and tools in TypeScript. Durable execution, sandboxed compute, approvals, subagents, and evals are already wired in.
Vercel is for shipping full-stack apps
Guillermo also highlighted Vercel's ability to host full stack applications, with support for additional backend frameworks, databases, and now, microservices.
Backends and databases
Earlier this year, Vercel brought on some of the best Python developers in the world to extend support for backend workloads.
You can now run FastAPI, Flask, Express, Hono, and other backend frameworks at scale on Vercel.
Backend-only services are also supported, so you can host REST APIs, durable workflows, queues, cron, and MCP servers.
The Vercel Marketplace added access to databases like Amazon Aurora, Aurora DSQL, DynamoDB, and OpenSearch directly from the Vercel dashboard.
Vercel Services
Guillermo announced the launch of Vercel Services, available July 1. With Vercel Services, microservices are now a first-class citizen on Vercel. You can develop and deploy your frontend and backend together, and backend-only changes still build the app in a full preview environment. And for the first time, those services can communicate with each other without touching the public internet.
Vercel is for shipping in the enterprise
For us, Next.js and eve made building agents the easy part. The hard part was everything around them: access, authentication, integrations, and proving all of it to the security team. Jeanne told the story of how we built an enterprise security platform for ourselves, then made it available to our customers.
Vercel for Enterprise Apps and Agents
Vercel for Enterprise Apps and Agents brings the Vercel developer experience to everyone at your company, with the identity, access, and governance needed to deploy safely.
Enterprise Managed Users (in Private Beta) centrally manages who can use Vercel and v0, with a full audit trail.
Vercel Passport keeps internal apps internal, private by default behind your IdP
Bring your own cloud (BYOC) on AWS (in Private Beta) gives you the ability to run Vercel in your own AWS tenant, including your Vercel functions.
Vercel Agent
Malte announced Vercel Agent (in Private Beta), the intelligence layer for shipping on Vercel. Built on eve and the Agent Stack, it monitors your production deployments, autonomously investigates alerts and anomalies, and opens fixes in PRs for you to review and approve.
Vercel Agent's first-of-its-kind permissions model combines plan mode with granting permissions, making it safe to use for both developers and the enterprise. Rather than asking you to approve actions one-at-a-time, Vercel Agent plans what permissions it will require to complete a task and then asks you to approve them in a single, coherent step. It runs as its own identity, is read-only by default, and asks for narrow, temporary permission before it touches production.
Ship 2026 in London
Ship week London
Our first Ship outside the U.S. ran five days of events leading into the keynote, and an ice cream truck spent the week working its way across the city.
Built in London hackathon
Two hundred builders shipped agents on Codex and Vercel in a hackathon with OpenAI. Three projects stood out. Stella hunts down unclaimed grants for London SMBs, Oscar is a co-pilot that sharpens your prompts before you send them to a model, and Phone Jail blocks distractions and roasts you when you reach for your phone anyway.
Media, Founder, VC, and CTO dinners
Reporters traded story ideas over a media dinner. Twelve founders talked through the future of AI in EMEA at a VC dinner. And a dozen CTOs from teams including Marks & Spencer and Currys went off the record on what it takes to build and scale agents in the enterprise.
Day Zero builder night
Day Zero, the day before the keynote, turned into a 400-person builder night. Enterprise teams Mentimeter, Okta, and MongoDB joined Vercel in a packed room alongside partners DeepMind, ElevenLabs, and Cursor.
AI Social Club
A 160-deep waitlist formed for Malte's talk A New Stack for a New Era of Software, followed by Guillermo and Deliveroo's Will Shu's chat on building the agentic enterprise.
Ship day sessions
André Balleyguier from Anthropic showed Claude Managed Agents on Vercel, where Anthropic hosts the agent loop while every command the agent runs executes inside a Vercel Sandbox you own, keeping its filesystem, processes, and network egress in your environment.
Tomas Jansson from Currys/Elkjøp showed how his team evolved a Nordic retailer's ecommerce stack from storefronts toward shopping agents in three phases, anchored by a Next.js migration that cut time to first byte by 40%. The end state is one where customer intent replaces navigation.
Matan Kushner from Vercel broke down how Vertex, Vercel's support agent, now automates 91% of support tickets and saves 5,000 engineer-hours a month without degrading as its context grows.
Jas Sagoo and Sam Bellen from Auth0 made the case that getting an agent into production depends more on identity than on model quality. They demoed four standards-based identity patterns on the Vercel AI SDK, Token Vault, CIBA approvals, agents as first-class principals, and on-behalf-of delegation, so every action is scoped and traces back to a human decision instead of a shared API key.
Abhi Sivasailam from Vercel went deep into d0, Vercel's internal data agent built on eve, which runs analyses in a sandbox and now gets 45% of its questions from other agents, rather than people.
Romain Huet from OpenAI showed developers how to ship faster by delegating whole tasks to Codex Cloud Agents on Vercel, and made the case that as agents become users of your product, you design for agent experience with scoped API keys, markdown docs, and plugins.
Michał Pierzchała from Callstack demoed a QA agent that runs mobile apps on real devices, explores user flows on its own, and posts screenshots, recordings, and logs to pull requests on every PR.
Alex Holt from ElevenLabs paired the ElevenLabs Speech Engine with the AI SDK to build a voice agent that can reply in under a second, take interruptions mid-sentence, and switch language mid-conversation.
Malavika Balachandran Tadeusz from Vercel showed the mechanics of how software can ship itself, extending the agent loop past development into testing, observability, and experimentation with primitives like Vercel Flags and Skills.
Panel: Agents in production
Jeanne Grosser, COO of Vercel, moderated a panel on taking agentic workloads from prototype to production with some of the EU's top CTOs and AI leaders from frontier labs. A few highlights:
Arthur Viegers (Cursor): Autonomy should track risk, and the better an agent can assess the risk of a change, the more you can let it run on its own. Shopify and Amplitude already auto-review and merge 60-70% of low-risk PRs with no developer time, while a two-line change to authentication still goes to a human.
André Balleyguier (Anthropic): To decide what an agent can do on its own, judge each action by how reversible it is and how large its blast radius is, then contain it accordingly, for example inside a self-hosted sandbox. As you grant more autonomy, observability and evals become the things that keep it safe.
Ryan den Rooijen (Currys): The predicted death of stores never arrived, and Currys leads its markets by betting on humans. The open question for agentic commerce is which shopping journeys customers want an agent to handle and which they still want a person for.
Nicolas Le Pallec (AKQA): AI-native customer experience replaces navigation with intent. Reaching it takes three layers: a way to capture true customer intent, a brand brain that stores brand and product data for AI systems to retrieve, and generative UI that composes pages on the fly instead of serving static ones.
Fireside chat with Harry Stebbings
The day ended with a fireside chat between Guillermo and Harry Stebbings from 20VC. Below are are excerpts from the lightening round at the end of their chat.
Guillermo Rauch: What are the attributes of a founder you want to back?
Harry Stebbings: The profile has changed completely. It used to be a sales-led CEO who could fundraise and grow customers, where personality and sales carried the company. Now I want an engineering- and product-led founder.
Guillermo Rauch: Can you teach someone to become a voice for their industry?
Harry Stebbings: You can, but it's hard. You have to do it for six months straight. It's a muscle you build, and you have to commit to it every day and every hour.
Guillermo Rauch: When anyone can produce content and software, how do you stand out?
Harry Stebbings: You come up with a new format, a new intro, a new way to tell the story and shape the work. The content itself has shifted too. We used to do shows about leadership and hiring, and nobody cares about that anymore. What lands now is a founder and AI. Those are the two things.
Ship what's next
Thanks for joining us for Ship 2026 in London. We will see you in Berlin, New York City, Sydney, and San Francisco. If you haven't signed up yet, there's still time to get a ticket.
Read more
関連記事
Vercel がオープンソース AI エージェントフレームワーク「Eve」をリリース:各エージェントは機能にマッピングされたファイルディレクトリとして定義される
Vercel は、生産環境で百以上のエージェントを実行している自社開発の基盤となるオープンソースフレームワーク「Eve」を公開した。このツールでは、エージェントの動作を定義する際にインフラ構築の手間を省き、各機能をファイルディレクトリにマッピングして管理できる仕組みを提供する。
HSBC、Google Cloud と AI 銀行提携を拡大
HSBC は Google Cloud と多年度提携を結び、グローバル業務で Gemini モデルなどを用いた AI ツールの開発・導入を開始する。
OpenAI、エージェント型コーディングにおける事前展開リスク評価に「デプロイメント・シミュレーション」手法を拡張
OpenAI は新手法「Deployment Simulation」を発表し、モデル出荷前に過去の会話を再現して現実的な文脈での振る舞いを検証する。これにより、従来の評価で見逃されていた盲点を特定し、エージェント型コーディングのリスク評価を強化した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み