Zo Computer、Vercel上でAI信頼性を20倍向上
Zo ComputerはVercelのAI SDKとAI Gatewayを導入することで、AIモデル呼び出しのリトライ率を20倍改善し、チャット成功率99.93%を達成し、新モデル追加時間を1分未満に短縮した。
キーポイント
AI信頼性の大幅向上
Vercel移行により、リトライ率が7.5%から0.34%へ20倍改善し、チャット成功率が98%から99.93%に向上した。
開発効率の劇的改善
カスタムアダプターコードからVercel AI SDKへの移行で、新モデル追加時間が1時間から1分未満に短縮され、小規模チームの負荷が軽減された。
インフラ複雑性の解消
AI Gatewayにより、リトライ、フォールバックルーティング、プロバイダー監視などのインフラレベルの複雑性がVercel側で管理されるようになった。
パーソナルAIクラウドの実現
Zo Computerは個人向けAIクラウドとして、複数プロバイダーのAIモデルに統一インターフェースでアクセスできる環境を提供している。
影響分析・編集コメントを表示
影響分析
この事例は、VercelのAI開発ツールが実運用環境でどの程度の効果を発揮するかを示す重要な実証データとなっている。特に、複数AIプロバイダーを統合するサービスの開発・運用効率を大幅に改善する可能性を示しており、AIエコシステム全体の成熟度向上に寄与する。
編集コメント
VercelのAIツールスイートの実運用効果を数値で示した貴重なケーススタディ。特に小規模チームが複数AIプロバイダーを効率的に統合する方法として参考になる。
タイトル: Zo Computer、VercelでAIの信頼性を20倍向上
Vercel上のZo Computer
リトライ率を20分の1に削減 (7.5% → 0.34%)
チャット成功率99.93%を達成 (98%から向上)
P99レイテンシーを38%削減 (131秒 → 81秒)
新モデルの追加が1分未満に
あらゆる企業は、データを保存し、サービスを実行し、24時間稼働するサーバーを保有しています。一方、消費者が持つのはアプリだけです。Zo Computerの共同創業者であるRob Cheungは、その隔たりを埋めようとしています。ZoはパーソナルAIクラウド、すなわち、常時稼働するエージェントを駆動する、あなた自身のサーバーとデータそのものです。
「クラウドは史上最高のコンピューティングモデルの一つですが、複雑すぎるため消費者は直接利用できません」と、Zoの共同創業者兼CEOであるRob Cheungは説明します。「しかし今、AIによって、私たち全員がクラウドコンピュータを持てる時代がようやく訪れました。」
Zoは単なるチャットボットではなく、完全なコンピューティング環境です。Robは、母親が知らないうちにサーバーやデータベースを運用している様子を笑い話にします。ユーザーはZoを使って小規模事業を管理し、研究を行い、家計を整理し、健康データを追跡しています。
設立2年半、8名のチームは野心的な目標を掲げています。2026年までに100万人の新規ユーザーをパーソナルクラウドコンピューティングに迎え入れることです。これは毎日数百万回のAIモデル呼び出しを意味し、ユーザーが友人にメッセージを送るように自分のエージェントにテキストを送る時、同様の応答性を求めることになります。
千のアダプターによる死(複雑性の負荷)
Zoはユーザーが望むあらゆるモデルへのアクセスを提供し、Bring-Your-Own-Key (BYOK) をサポートしています。つまり、彼らのバックエンドはすべての主要プロバイダー(OpenAI、Anthropic、MiniMax、GLM、Fireworksなど)と通信する必要がありました。
Vercel移行前、これは各モデルごとのカスタムアダプターコードを意味していました。プロバイダーごとに画像処理、キー管理、エッジケースへの対処方法が異なり、コードの複雑さに加え、Zoチームはリトライ、プロバイダールーティング、フォールバックロジックを自ら管理しなければなりませんでした。
プロバイダーが新モデルをリリースするたび、エンジニアは新たなアダプターを書き、エッジケースをテストし、デプロイメントパイプラインを実行する必要がありました。新モデルが毎週リリースされる中、これは消費者向け製品を開発する小規模チームにとって持続的な負担となり、ユーザー体験にも影響を与えていました。
ZoのAIモデル呼び出しのベースラインは成功率98%、リトライ率7.5%でした。つまり、50件に1件のメッセージが失敗または再試行され、毎日数万件のモデルフォールバックが発生していたのです。
AI SDK + AI Gateway: 2層で実現するシンプルな統合
ZoはVercelのAI SDKとAI Gatewayに移行し、2つの異なる問題を解決しました。
AI SDKはカスタムアダプターコードを置き換えました。プロバイダーごとの個別実装や独自のエッジケース処理の代わりに、Zoのエンジニアは、画像サポートからレスポンス形式の正規化まで、あらゆるモデルに対して統一されたインターフェースを手にしました。
AI Gatewayはインフラストラクチャーレベルの複雑さを解消しました。リトライ、フォールバックルーティング、プロバイダー健全性監視、稼働時間の管理はすべて、Zoのコードベース内ではなく、Vercelのルーティングレイヤーで処理されるようになったのです。
Robの共同創業者は、開発者体験そのものが製品であったStripeでAPIを構築した経験を持ちます。彼はAI SDKとAI Gatewayの相乗効果を同じ観点で説明します。「すべてが期待通りに動作し、見えない部分の仕組みが最も重要だ」と。
新モデルのサポートは、1時間を要する複数ファイルのコード変更から、30秒で設定文字列を追加するだけに変わりました。MiniMaxがM2.7をリリースした日、Zoは即座にユーザー提供を開始できました。アダプターコードの作成も、エッジケースのテストも、デプロイサイクルも必要ありませんでした。
最初の100万人のユーザー獲得に注力する8名のチームにとって、モデルサポートに伴う作業の中断がなくなったことは、大きな安心をもたらしました。
信頼性の20倍向上
移行期間中、ZoはVercelルートと非Vercelルートを並行して実行し、同一の本番環境条件下でライブA/B比較を実施しました。
結果は以下の通りです:
| 期間 | ルート | POSTエラー | チャット成功率 | リトライ率 | 平均試行回数 |
|---|---|---|---|---|---|
| 切り替え前 | 非Vercel | 4.59% | 99.73% | 7.52% | 1.12 |
| 切り替え後 | 非Vercel | 10.38% | 97.86% | 17.07% | 1.29 |
| 切り替え後 | Vercel | 0.45% | 99.93% | 0.34% | 1.00 |
Vercelルートが安定している間、非Vercelルートのパフォーマンスは実際に悪化しました。リトライ率は7.5%から0.34%へ、つまり20倍の改善が見られました。チャットあたりの平均試行回数が1.00に達したことは、事実上すべてのリクエストが初回試行で成功したことを意味します。
Zoで最も使用されているモデルであるMiniMax M2.5では、レイテンシー改善が顕著でした。同一期間での公平な比較において、Vercelは非Vercel(21,105件)に対して18,139件のチャットを処理しながらも、すべての指標で優れたパフォーマンスを示しました:
- 平均レイテンシー: 25.7%改善
- P95: 46秒 → 34秒 (25%改善)
- P99: 131秒 → 81秒 (38%改善)
Zoのユーザーにとって、このP99の数値が最も重要です。彼らは一日中絶え間なくエージェントとメッセージを交わすためです。最悪の場合131秒も待たされることは体験を完全に損ないますが、今では99%のリクエストが81秒未満で完了します。
テスト終了時までに、Zoのトラフィックの91.88%がVercelを経由するようになり、非Vercelパスと比べて3.3倍大きいコンテキストウィンドウ(平均入力トークン数 42,500対12,700)を、より低いエラー率で処理しました。
100万人のパーソナルクラウド所有者へ向けたスケーリング
Vercelは、AI SDKとAI Gatewayを通じてZoのAIレイヤーを処理し、対外向けマーケティングサイトもホストしています。信頼性の高いAIインフラストラクチャーと、維持管理の必要なアダプターコードがなくなったことで、チームは「配管」作業ではなく、製品そのものの開発に集中できます。
AIのモデル開発の速さを考えると、Robは以前は追従するための作業負荷を心配していました。「今はもう心配していません」と彼は語ります。「Vercelでは、インフラストラクチャーがただ確実に機能するからです。」
Zo Computerは、各ユーザーに独自のクラウドコンピュータ、データ、サービス、パーソナルエージェントを提供するパーソナルAIクラウドプラットフォームです。ユーザーはiMessageのような会話型インターフェースを介して対話するか、ログインして環境を直接利用します。設立2年半のZoは、ニューヨーク市に拠点を置く8名のチームです。詳細は zo.computer をご覧ください。
さらに読む
原文を表示
Zo Computer on Vercel
20x reduction in retry rate (7.5% → 0.34%)
99.93% chat success rate (up from 98%)
P99 latency cut 38% (131s → 81s)
New models are added in less than 1 minute
Every company has servers that store data, run services, and do work around the clock. Consumers just have apps. Rob Cheung, co-founder of Zo Computer, is closing that gap. Zo is a personal AI cloud: your own servers and data that power an always-on agent.
"Cloud is one of the best computing models of all time, and consumers have zero direct access because it's so complicated," explained Rob Cheung, co-founder and CEO of Zo. "Now, with AI, it's finally possible for all of us to have cloud computers."
Zo is a full computing environment, not just a chatbot. Rob laughs about his mom running servers and databases without knowing it. People use Zo to manage small businesses, do research, organize finances, and track health data.
The 8-person company is two and a half years old and they have an ambitious goal: to onboard one million new users to personal cloud computing in 2026. That means millions of AI model calls every day, and when Zo users text their agent like a friend, they expect the same responsiveness.
Death by a thousand adapters
Zo gives users access to any model they want, and supports bring-your-own-key. That means their backend has to talk to every major provider: OpenAI, Anthropic, MiniMax, GLM, Fireworks, and more.
Before they moved to Vercel, that meant custom adapter code for each model. Every provider required different handling for images, different key management, and different edge cases. On top of the code complexity, Zo's team was managing retries, provider routing, and fallback logic themselves.
Every time a provider shipped a new model, an engineer had to write a new adapter, test the edge cases, and run the deployment pipeline. With new models released weekly, it was a constant drag on a small team building a consumer product, and their users felt it.
Zo's baseline for AI model calls was a 98% success rate with a 7.5% retry rate. That means 1 in 50 messages failed or retried, adding up to tens of thousands of model fallbacks every day.
AI SDK + AI Gateway: two layers, one integration
Zo moved to Vercel's AI SDK and AI Gateway, which solved two distinct problems.
AI SDK replaced the custom adapter code. Instead of per-provider implementations with bespoke edge case handling, Zo's engineers got a unified interface for every model, from image support to response format normalization.
AI Gateway replaced the infrastructure-level complexity. Retries, fallback routing, provider health monitoring, and uptime were all handled at the routing layer in Vercel instead of in Zo's codebase.
Rob's co-founder built APIs at Stripe, where developer experience was the product. He describes the combined effect of AI SDK and AI Gateway the same way: everything just works, and the pieces you don't see matter most.
New model support went from an hour-long, multi-file code change to adding a config string in 30 seconds. The day MiniMax shipped M2.7, Zo had it live for users immediately. No adapter code, no edge case testing, no deploy cycle.
For an 8-person team focusing on onboarding their first million users to personal cloud computing, cutting out interruptions for model support has been a huge relief.
20x improvement in reliability
During the rollout, Zo ran Vercel and non-Vercel routes simultaneously, creating a live A/B comparison under identical production conditions.
The results:
Period
Route
POST error
Chat success
Retry rate
Avg attempts
Before switch
Non-Vercel
4.59%
99.73%
7.52%
1.12
After switch
Non-Vercel
10.38%
97.86%
17.07%
1.29
After switch
Vercel
0.45%
99.93%
0.34%
1.00
The non-Vercel route actually degraded during the same period that Vercel held steady. Retry rate dropped from 7.5% to 0.34%, a 20x improvement. Average attempts per chat hit 1.00, meaning virtually every request succeeded on the first try.
On MiniMax M2.5, Zo's most-used model, the latency improvement was significant. In an apples-to-apples comparison over the same window, Vercel handled 18,139 chats versus 21,105 on non-Vercel and still performed better across the board:
Average latency improved 25.7%
P95: 46s → 34s (25% improvement)
P99: 131s → 81s (38% improvement)
For Zo's users, the P99 number matters most because they text their agents constantly throughout the day. A 131-second worst-case wait breaks that experience completely, but now 99% of requests complete in under 81 seconds.
By the end of the test, 91.88% of Zo's traffic routed through Vercel, handling 3.3x larger context windows (42,500 average input tokens vs. 12,700) at a lower error rate than the non-Vercel path.
Scaling to a million personal cloud owners
Vercel handles Zo's AI layer through AI SDK and AI Gateway and hosts their public-facing marketing site. With reliable AI infrastructure and no adapter code to maintain, the team can focus on the product instead of the plumbing.
With the pace of model developments in AI, Rob used to worry about the work required to keep up. “Now I don’t worry about it,” he said, “because with Vercel, the infrastructure just works.”
Zo Computer is a personal AI cloud platform that gives every user their own cloud computer, housing data, services, and a personal agent. Users interact through a conversational interfaces like iMessage, or log in and use the environment directly. Founded two and a half years ago, Zo is an 8-person team based in New York City. Learn more at zo.computer.
Read more
関連記事
米国、中国企業向け Nvidia 最高級チップの海外販売ループホールを閉鎖へ
米商務省は、本社が中国にある企業の海外子会社による NVIDIA 製先端チップ購入にも輸出ライセンス要件を適用する指針を発出し、既存の回避策を封じる方針を示した。
GitHub 初心者向け:OSS コントリビュート入門ガイド
GitHub は、オープンソースソフトウェアのコミュニティへの参加方法やプロジェクトの探し方、リポジトリの読み方を解説し、初めてのコントリビューション開始を支援する。
VS Code の Git 拡張機能による Copilot の自動クレジット表示を修正
Microsoft は、開発者の不満を受け、Git 拡張機能がデフォルトで AI ツール「Copilot」に貢献者としてクレジットを表示する変更を撤回し、修正した。