3600億トークン、300万顧客、6人のエンジニア
AIビジネスビルダー「Durable」は、少数のエンジニアで年間3600億トークンを処理し、300万の顧客にサービスを提供するマルチテナントプラットフォームを構築し、AIエージェントの実用化とインフラ効率化の成功事例を示した。
キーポイント
大規模AI処理の効率性
Durableはわずか6人のエンジニアで、AI機能とエージェントを通じて1日約11億トークン(年間3600億トークン)を処理し、エンジニア、プロダクトマネージャー、デザイナーそれぞれに10倍のレバレッジを実現している。
マルチテナントインフラの課題解決
数百万の顧客サイト、CRM、エージェントを管理するマルチテナントプラットフォームにおいて、カスタムドメインとSSLのスケーリング、マルチリージョンクラスターのメンテナンス、セキュリティとボット保護、観測可能性とコスト配分といった課題を解決した。
AIエージェントの製品化への移行
AIを単なる「配管」から製品の核心へと進化させ、SEO、コンテンツ、運用などを扱うマルチエージェント、マルチモデル、マルチモーダルの製品を提供している。
コスト効率と迅速な展開
セルフホスティングと比較して3〜4倍低いインフラコストを実現し、新しいプロダクションエージェントを顧客に1日で出荷できる迅速な展開能力を獲得した。
移行の成功要因
既存スタックの制限を認識し、Vercelのシンプルさを活用して、コード変更前にインフラを一気に切り替える決断的な移行を実施した。
効率性とスピードの向上
Vercelへの移行により、コスト効率が大幅に改善され、新規エージェントの顧客への提供を1日で可能にするなど、開発速度が向上した。
小規模チームでの大規模成果
6人のエンジニアで3600億トークンと300万人の顧客を扱うシステムを構築し、将来のテック企業の運営モデルを示した。
影響分析・編集コメントを表示
影響分析
この記事は、AIエージェントの大規模実用化における技術的・運用的成功事例を示しており、SaaS企業がAI機能を効果的に製品化し、少数チームで大規模サービスを運営するための実践的なモデルを提供している。特にマルチテナント環境でのコスト効率と迅速な展開能力は、AIサービス提供企業にとって重要な参考事例となる。
編集コメント
営業PR色が強いが、具体的な数値(トークン数、顧客数、エンジニア数、コスト削減率)に裏打ちされた実践的成功事例として、AIサービス提供企業の運営モデル設計に貴重な示唆を与える内容。
一目でわかるインパクト
Durableは新規プロダクションエージェントを顧客に1日で出荷
AI機能とエージェントは1日約11億トークン(年間3600億トークン)を処理
エンジニア、プロダクトマネージャー、デザイナーそれぞれに10倍のレバレッジを提供
セルフホスティングと比較してインフラコストを3〜4分の1に低減
Durableは、シンプルな目標から始まりました。それは、仕事を持つよりもビジネスを所有することを簡単にすることです。
アメリカ成人の60%が自らボスになりたいと望んでいますが、実際にそうしているのは約4%のみです。Durableの見立てでは、障壁は野心ではなく「摩擦」にあります。「中小企業は、数え切れないほどのツール、ログイン、ワークフロー、デザインによって息の根を止められています」と、Durableの創業者James Cliftは説明します。「それらの障壁を取り除けば、ビジネスオーナーは顧客に集中できるのです。」
現在、DurableはAIビジネスビルダーとして、起業家が数分でビジネスを立ち上げ、SEO、コンテンツ、運用などを処理するエージェントによって最適化できるよう支援しています。アイデアと事業所有の間のギャップは、かつてないほど小さくなりました。
顧客にはシームレスな体験として感じられますが、内部では、数百万もの個別ビジネスを安全に、確実に、かつコスト効率よく運営しなければならないマルチテナントでマルチプロダクトのプラットフォームなのです。
事業が拡大するにつれ、セルフホスティングのためだけに複数のサービスを手動で運用することは、第二のプロダクトを開発するほどの労力になっていました。
小さなチームであるDurableは、漸進的な改善よりも迅速な統合を選択しました。すなわち、単一のコードベース、単一のインフラプラットフォームです。
インフラは難しい。マルチテナントインフラはさらに難しい。
Durableが提供しているのは単一のアプリではありません。数百万に及ぶ顧客サイト、CRM、エージェントを管理しており、それぞれが異なるトラフィックパターンと運用ニーズを持っています。
ある顧客サイトのトラフィックが別のサイトの100倍に達することもあり、べき乗則はすぐに顕在化します。トラフィックが急増すると、Durable顧客の一部が計算リソースの不均衡な割合を消費する可能性があり、コストの分離、帰属、価格戦略は重要なエンジニアリング課題となりました。
Khanは、セルフホスティングにおける最も深刻な課題をいくつか挙げています:
- SaaS規模でのカスタムドメインとSSL:カスタムドメインのSSL終端に数千ドルを支払うことも含む
- マルチリージョンクラスターのメンテナンス:以前はインフラエンジニアが複数地域にまたがるクラスターの稼働を維持する必要があった
- マルチテナントリスクとしてのセキュリティとボット対策:1人の顧客を標的としたDDoS攻撃が他のサイトのパフォーマンスを低下させないようにする
- 数百万テナントにわたる可観測性とコスト帰属
「配管」としてのAIから「プロダクト」としてのAIへ
Durableは、単なるサイト以上のものを提供しています。マルチエージェント、マルチモデル、マルチモーダルのプロダクトを通じて、顧客のビジネス運営を支援するのです。
エージェントがプラットフォームのコアとなった時、開発者はウェブサイトプラットフォームのセルフホスティングとは根本的に異なる3つの問題に直面しました:
- モデルオーケストレーション:信頼性とコストのためにモデルやプロバイダーを迅速に切り替える必要があり、長期契約に縛られたり、障害や新モデルリリースのたびにシステムを再構築したりしない方法が求められた。
- テナント分離:マルチテナントエージェントシステムでは、「コンテキスト漏洩」は存続に関わる問題です。あるビジネスのコンテキストが別のワークフローに決して漏れないよう、厳格なガードレールが必要でした。
- 顧客ごとのAI経済性:AIワークロードは大きく異なるため、使用量ベースまたは成果ベースの価格設定を正確にサポートするには、実行内容、モデル、支出に関する顧客レベルの可視性が不可欠でした。
セルフホスティングとAIインフラの管理は、Khanの6人チームにとって大きな負担だったため、彼はプラットフォームをマルチテナントAIワークロード向けに設計された単一システムに統合することを選択しました。
移行、そして成功の理由
チームは、既存の技術スタックが顧客とプラットフォームの問題を迅速に解決する能力を制限していると気づきました。競争に勝つためには、これらの課題と将来の課題を他社よりも速く解決する必要があると理解していました。「我々はAIネイティブなアプリケーションです」とKhanは説明します。「AWSインフラを構築するのではなく、エージェントで価値を創造することに集中しなければなりません。」
Khanは、Vercelのシンプルさがアプリ移行を可能にしたと述べています。彼はインフラのアップグレードを、コードに触れる前に実行した決定的な一手と表現しました。「iframeを使って旧プロダクトの外観を維持したまま、Vercelに本番環境としてデプロイし、その後、セルフホスティングのインフラを完全に撤去しました。」
彼らは旧来の方法でリファクタリングはしませんでした。少人数チームのDurableは、コーディングエージェントを活用して書き直しを加速し、モデルの改善に合わせてトークンを消費して迅速に進め、最終的にはプロダクション品質のコードベースを完成させました。
「誰もがプロダクトを書き直すなと言います」とKhanは言います。「しかし、我々はまさにそれを実行し、成功したのです。」
リソース制約が移行の動機ではなかったにもかかわらず、新しいインフラははるかにコスト効率が高いことも判明しました。
現在、Durableのスタック全体がVercel上で動作しており、新規エージェントを顧客に1日で出荷できるようになりました。
スタックの領域 | DurableがVercelで使用しているもの
--- | ---
アプリのビルド、出荷、実行 | Next.js, Functions, Fluid Compute, Turborepo, Flags, Toolbar
AI + エージェント | Durable Agents, AI SDK, AI Gateway, Workflows, Skills
エッジ配信 + マルチテナントルーティング | CDN, Domains (API), Cron
セキュリティ + 悪用防止 | Firewall, Bot Protection, BotID, Sandbox
可観測性 + パフォーマンス | Analytics, Speed Insights, OpenTelemetry
データ + 出力 | Blob (公開および非公開アセット), Streamdown, json-renderer
より多くの起業家を支える10倍のレバレッジ
Durableは300万以上のビジネスにサービスを提供しています。「フェアでチョコレートをかけたバナナを売る19歳、テキサスで休日のポーチ装飾ビジネスを営む人、免許を取得したばかりの配管工、解雇されたばかりのテック企業幹部を想像してください」とKhanは言います。「これらはすべて、9時から5時までの労働を拒否し、起業家として自らの未来を築いているDurableの顧客です。」
これは、DevOpsチームなしの6人のエンジニアにとっては驚異的な成果です。Durableの創業者James Cliftは、Vercel上で運営することで100倍のレバレッジを得たと感じています。
「これほど少人数のチームで実現できたことは驚くべきことです」とCliftは振り返ります。「これこそが、将来のすべてのテック企業のあるべき姿です。」
原文を表示
Impact at a glance
Durable ships new production agents to customers in a single day
AI features and agents serve ~1.1B tokens per day (360B per year)
10x leverage for every engineer, product manager, and designer
3-4x lower infra cost compared to self hosting
Durable began with a simple goal: make owning a business easier than having a job.
60% of U.S. adults say they want to be their own boss, but only about 4% actually do it. Durable’s bet is that the blocker isn’t ambition. It’s friction. “Small businesses are death by a thousand tools, logins, workflows, and designs,” explained James Clift, founder of Durable. “If you remove those barriers, business owners can focus on their customers.”
Today, Durable is an AI business builder that helps entrepreneurs launch in minutes, then optimize with agents that handle things like SEO, content, and operations. The gap between idea and ownership has never been smaller.
It feels like one seamless experience to their customers, but under the hood it’s a multi-tenant, multi-product platform that has to run millions of individual businesses safely, reliably, and cost-effectively.
As they scaled, manually operating multiple services just to self-host was enough work to be a second product.
With a small team, Durable chose rapid consolidation over incremental improvement: one codebase, one infrastructure platform.
Infra is hard; multi-tenant infra is harder
Durable isn’t serving one app. They are managing millions of customer sites, CRMs, and agents, each with different traffic patterns and different operational needs.
One customer site might get 100x the traffic of another, and power laws show up quickly. When spikes happen, a small portion of Durable customers can consume a disproportionate share of compute, which made cost isolation, attribution, and pricing strategy significant engineering problems.
Khan called out a few of the most acute pain-points from self-hosting:
Custom domains and SSL at SaaS scale, including paying thousands of dollars for SSL termination for custom domains
Multi-region cluster maintenance, which previously required infrastructure engineers to keep clusters running across multiple geographies
Security and bot protection as a multi-tenant risk, so that DDoS attacks aimed at one customer don’t degrade the performance of other sites
Observability and cost attribution across millions of tenants
From AI as plumbing to AI as product
Durable offers more than sites. They help their customers run businesses with a multi-agent, multi-model, multi-modal product.
Once agents became a core part of their platform, their developers ran into three problems that were fundamentally different from self-hosting a website platform:
Model orchestration: They needed to switch models and providers quickly for reliability and cost, without getting locked into long contracts or reworking the system every time there was an outage or a new model release.
Tenant isolation: In a multi-tenant agent system, “context spilling” is existential. Durable needed strict guardrails so one business’s context could never leak into another’s workflows.
Per-customer AI economics: AI workloads vary wildly, so Durable needed customer-level visibility into runs, models, and spend to support usage-based or outcome-based pricing with real fidelity.
Managing self-hosting and AI infrastructure was a massive distraction for Khan's team of six, so he chose to consolidate their platform into a single system designed for multi-tenant AI workloads.
The migration, and why it worked
The team realized their existing stack was limiting their ability to solve their customer and platform problems quickly. They knew that in order to win, they needed to tackle those, and future challenges, faster than the competition. “We’re an AI native application,” Khan explained, “so we must focus on creating value with agents, not building out AWS infrastructure.”
Khan said that the simplicity of Vercel made their app migration possible. He described the infrastructure upgrade as a single, decisive swing they implemented before touching their code: "We skinned the old product using an iframe, pushed to production on Vercel, then ripped out the self-hosted infrastructure entirely."
They didn’t refactor the old way. With a lean team, Durable used coding agents to accelerate the rewrite, burning tokens to move faster as models improved, ultimately emerging with a production-quality codebase.
“Everyone tells you not to rewrite your product,” said Khan, “but we did exactly that, and it worked.”
Even though resource constraints weren't the motivation for the move, their new infrastructure turned out to be far more cost-efficient as well.
Today, Durable’s entire stack runs on Vercel, and they can ship new agents to their customers in a single day.
Area of stack
What Durable uses on Vercel
Build, ship, and run the app
Next.js, Functions, Fluid Compute, Turborepo, Flags, Toolbar
AI + agents
Durable Agents, AI SDK, AI Gateway, Workflows, Skills
Edge delivery + multi-tenant routing
CDN, Domains (API), Cron
Security + abuse prevention
Firewall, Bot Protection, BotID, Sandbox
Observability + performance
Analytics, Speed Insights, OpenTelemetry
Data + output
Blob (public & private assets), Streamdown, json-renderer
10x leverage to support more entrepreneurs
Durable serves more than 3 million businesses. “Think about a 19-year-old selling chocolate-covered bananas at fairs, a holiday porch decoration business in Texas, a plumber who just got their license, and a tech exec who just got laid off,” said Khan. “Those are all Durable customers who are rejecting the 9-5 and building their own future as entrepreneurs.”
That’s impressive for 6 engineers and no DevOps team. James Clift, founder of Durable, feels like they've gotten 100x leverage running on Vercel.
"It’s incredible what we’ve shipped with such a lean team," Clift reflected. "This is how every tech company in the future will operate."
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み