SERHANT.の迅速なAIイテレーションのためのプレイブック
SERHANT.はVercelのAI SDKとゲートウェイを活用し、基盤再構築なしで複数のLLMをタスク別に切り替える柔軟なアーキテクチャを実現し、800名以上のエージェントへ迅速にスケールした。
キーポイント
AI SDKによるベンダーロックインの回避と抽象化
Vercel AI SDK を採用することで、異なるモデルプロバイダ間の複雑さを抽象化し、基盤再構築なしにモデルを切り替える柔軟性を確保した。
タスク最適化によるマルチモデル戦略
Claude Sonnet を高精度な分析に、Haiku を軽量処理に割り当てるなど、コストと出力のバランスを取るためタスクごとに最適なモデルをオーケストレーションしている。
インフラ再構築なしのスケーリング
Next.js と Vercel の基盤を維持したまま、API レヤーを変更せずに iOS アプリへ展開し、パイロットから 900 名以上のユーザーへ拡大することに成功した。
AI Gateway による可視化とコスト管理
複数のアプリやプロトタイプにわたる使用状況を一元管理し、デバッグの高速化とコスト最適化のための明確なフィードバックループを確立した。
モデルの用途別最適化とガバナンス
Claude Haiku、OpenAI、Geminiをそれぞれ軽量タスク、会話型インタラクション、画像生成・自動化に使い分け、出力検証やトークンコスト管理のための「ガードレール」戦略も導入している。
APIレイヤー変更なしでの無負荷スケール
S.MPLEの公開後、インフラの変更を一切行わずに900人以上のユーザーと劇的に増加したコンテンツ生成量(主要5社合計より35%多い)をFluid computeが自動的に処理し、シームレスな拡張を実現した。
単発自動化から協調型エージェントへ
従来の直線的なワークフローから脱却し、人間が実行を誘導・修正できる会話型AIエージェントや、複数のタスクを組み合わせた「レシピ」を実行するネットワーク構築へと進化している。
影響分析・編集コメントを表示
影響分析
この記事は、急速に変化する AI 環境において、エンジニアがインフラの維持管理に時間を割かずにプロダクトの価値創造に集中できるアーキテクチャの実証例を示しています。特に、複数の LLM を状況に応じて動的に切り替える「マルチモデル戦略」を、実務レベルで成功させた事例は、今後の AI アプリ開発における標準的なプラクティスとして広く参照される可能性があります。
編集コメント
インフラの複雑さを抽象化する SDK の活用により、AI プロダクト開発における「速度」と「柔軟性」の両立が現実的なものとして示されています。特にマルチモデル戦略の実装事例は、コスト管理と品質担保を同時に達成したい企業にとって極めて参考になる内容です。
一目でわかるインパクト
Vercel上のNext.jsから開始。この基盤により、バックエンドを再構築することなくReact Native iOSアプリへ容易に拡張を実現。
エンジニアは、プラットフォームの基盤構築ではなく、AIの設計とイテレーションに集中。
タスクごとにOpenAI、Claude、Geminiをオーケストレーションし、コスト対効果を最適化。
内部パイロットから、プラットフォーム移行なしで800〜900名以上の不動産エージェントへスケール。
ジェレミー・バンティングが2024年2月にSERHANT.のエンジニアリング担当副社長(VP of Engineering)に就任したとき、S.MPLEはすでに有望な手応えを示していた。200名の不動産エージェントが、市場分析やコンタクト管理といった煩雑で繰り返しの多い日常業務を自動化し時間を節約するために設計された、このAI製品のパイロット運用に参加していた。
S.MPLEはVercelにデプロイされたNext.jsのプログレッシブウェブアプリであり、この基盤がチームに優位性をもたらした。APIレイヤーを安定させたまま、React Native iOSアプリへの拡張を含むクライアント体験を拡張でき、バックエンドの再構築は一切必要なかった。
しかし、バンティングには多くのエンジニアリングリーダーを悩ませる問題があった。AIを取り巻く環境の変化が、ほとんどのチームがインフラ更新を実施するスピードよりも速いという事実だ。
チームは迅速に動き、確信を持ってスケールし、モデルの切り替え、新機能の追加、急速に変化するAI環境への適応が可能な柔軟性を維持する必要があった。従来のアプローチでは、開発速度と柔軟性のどちらかを選ばなければならなかったが、バンティングはその両方を求めた。
AI SDK: ベンダーロックインなしで迅速に開発
S.MPLEが「単一モデル」の実験段階から本番AI製品へと移行する中、バンティングのチームはVercelのAI SDKの評価を開始した。彼は当初、懸念を抱いていた。「これがどれだけ我々をVercelに直接縛り付けることになるのか」と尋ねたことを彼は回想する。
その後、チームのエンジニアの一人が異を唱えた。AI SDKはインフラのロックインではなく、インフラの独立性をもたらすものだと。そのエンジニアは、「これは単に、異なるモデルプロバイダーを扱う際の複雑さを抽象化するSDKです」と指摘した。
バンティングはまた、チームが一つの最先端モデルを選択し、それに密結合した形で構築してしまうと、将来のあらゆる変更にはコードの書き直しが伴い、信頼性やコストが変化した際の明確なフォールバック経路がなくなることにも気づいた。AI SDKを使えば、イテレーションは単なる設定変更で済み、機能の大規模な改修は必要ない。「我々はエージェント的なツールを構築している」とバンティングは言う。「その一貫した抽象化レイヤーを持つことで…認知負荷が実質的に軽減されるのです」
AI Gatewayはさらなる優位性の層を追加した。チームが独自のAPIキーを持ち込む場合でも、アプリやプロトタイプ全体の使用状況に関する統合された可視性を提供する。その結果、デバッグと最適化が迅速化し、コストに関するフィードバックループも明確になった。
コスト、速度、複雑さのバランスを取るための複数モデルの活用
SERHANT.のS.MPLEチームは、インフラの再構築や個別のAI統合の維持に時間を取られていなかったため、実際の製品タスクに対してモデルをテストし、各作業に最適なツールを選択することに注力できた:
- Claude Sonnet: 比較市場分析など、強力な構造化データ推論が求められる、複雑で正確性が重要な分析タスク向け。
- Claude Haiku: 速度が重視される、軽量な意図把握やフィールド入力タスク向け。
- OpenAIモデル: 会話型音声や一般的なチャット動作向け。
- Gemini: 信頼性と速度が優先される、画像生成、ブラウザ自動化、コンピュータ使用ワークフロー向け。
また、出力を検証または批評する「ガードレールとしてのモデル」の実験や、利用増加に伴うトークン支出を抑制するためのキャッシング戦略も試みている。
心配無用のスケール:ユーザーとアセットの追加
彼らの技術スタックに関する判断の価値は、S.MPLEが公開リリースされた時に明らかになった。「我々は内部パイロットプログラムから900名以上のユーザーへと、インフラやスケーリングについて大きな心配をすることなく移行できました」とバンティングは言う。APIレイヤーには一切の変更が必要なく、Fluid computeがワークロードの増加を自動的に処理した。
このシームレスなスケーリングは重要である。なぜなら、SERHANT.はほとんどのシステムが耐えられないようなペースでコンテンツを生成しているからだ。「SERHANT.は上位5社の仲介会社を合わせた量よりも約35%多くのコンテンツを生成しています」とバンティングは指摘する。物件動画、物件説明文、マーケティング資料、そして現在はAI生成アセットを含め、その量は膨大である。
S.MPLEチームのテクニカルディレクター、グレッグ・パーソンズは、AI Gatewayによって以前は不可能だったプラットフォーム全体の可視性が得られると述べた。「事業全体で構築している、ばらばらなアプリケーションすべてに対する洞察を得ることができるのです」とパーソンズは説明する。
次のステップ:線形ワークフローから会話型AIエージェントへ
S.MPLEは線形ワークフローから始まった。不動産エージェントが単一のアクションをトリガーすると、それがエンドツーエンドで実行され、結果が返されるというものだ。
しかし、現実世界のワークフローはより複雑で、ユーザーは物件リストの販促に必要なすべてのアセットを生成するといった、単一の実行で複数のタスクを処理したいと考えている。バンティングのチームは現在、人間がエージェントを実行し、実行中に方向修正を行い、複数の「レシピ」を単一のリクエストに組み合わせられる会話型体験に向けて開発を進めている。
これは、単発の自動化から、AIエコシステム自体と同じ速さで進化するように構築された、専門化されたエージェント群の調整されたネットワークへの移行である。
予測不可能な環境に対する将来への備え
SERHANT.の最高技術責任者(CTO)、グレッグ・チャンは、柔軟性こそが核心だと考えている。「AIの世界では、物事が猛烈な速さで進化しています。現在の状況は3〜6ヶ月前とさえ異なります。そして数ヶ月後にはまた変わっているでしょう」とチャンは言う。
チャンにとっての勝利は、世界が変わるたびに技術スタックを書き直すのではなく、エコシステム内で構築を続けられることだ。「新しいモデルが登場するたびにスタックを再構築するのは、我々が最も避けたいことです」と彼は語った。
SERHANT.について
SERHANT.はAIネイティブの不動産およびメディア企業であり、世界で最もフォロワーの多い不動産ブランドです。
トップ不動産ブローカー兼起業家のライアン・セラントによって2020年に設立されたSERHANT.は、仲介、メディア、教育を統合し、独自技術を用いて物件のマーケティング、販売、体験方法に革命を起こしています。
SERHANT.は、高資産クライアント向けの「SERHANT. Signature」や、新築住宅プロジェクトのエンドツーエンドのブランディング、マーケティング、販売を提供する「SERHANT. New Development」を含む専門部門を通じて、全国的に住宅、商業、高級、新築開発物件を販売しています。
SERHANT.の独自AIプラットフォームであるS.MPLEによって駆動され、エージェントは物件リスト、取引、マーケティング全体でリアルタイムデータとワークフロー自動化を活用し、時間を節約しながら、より速く、よりスマートで、よりインパクトのある結果を提供することが可能になります。受賞歴のあるSERHANT. Studiosは、ソーシャルおよびストリーミングプラットフォームでオリジナルコンテンツを制作し、SellIt.comは同社のデジタル教育ハブとして、130か国以上の世界中のメンバーを惹きつけています。
詳細はserhant.comをご覧ください。
原文を表示
Impact at a glance
Started with Next.js on Vercel, which made it easier to expand to a React Native iOS app without rebuilding their backend
Engineers focus on AI design and iteration instead of platform plumbing
Orchestrates OpenAI, Claude, and Gemini by task to optimize cost vs output
Scaled from an internal pilot to 800–900+ real estate agents without replatforming
When Jeremy Bunting joined SERHANT. as VP of Engineering in February 2024, S.MPLE was already showing promise. 200 real estate agents were piloting the AI product, which was designed to save time by automating cumbersome and repetitive daily tasks, like market analysis and contact management.
S.MPLE was a Next.js progressive web app deployed on Vercel, and that foundation gave the team leverage. They could keep the API layer steady while expanding the client experience, including expansion to a React Native iOS app, all without a backend rebuild.
But Bunting had a problem that keeps many engineering leaders up at night: the AI landscape changes faster than most teams can implement infrastructure updates.
The team needed to move fast, scale confidently, and stay flexible enough to swap models, add new capabilities, and adapt to the rapidly changing AI landscape. Traditional approaches meant choosing between velocity and flexibility, but Bunting wanted both.
AI SDK: Moving fast without vendor lock-in
As S.MPLE shifted from "one model” experiments to a production AI product, Bunting's team started evaluating Vercel's AI SDK, and he initially had concerns. "I asked, how much is this going to tie us in directly to Vercel?" he recalls.
Then one of his engineers pushed back. The AI SDK wasn't infrastructure lock-in, it was infrastructure independence. “It's just an SDK that abstracts away the complexity of working with different model providers”, the engineer pointed out.
Bunting also realized that if the team picked one frontier model and built tightly around it, every future change would come with a rewrite, with no clean path to fallback when reliability or cost shifted. With AI SDK, iteration meant simple configuration changes, not feature overhauls. "We are building agentic tools," said Bunting. "Having that consistent abstraction layer... really reduces the cognitive load."
AI Gateway added another layer of leverage: consolidated visibility into usage across apps and prototypes, even when teams bring their own keys. The result is faster debugging, faster optimization, and a clearer feedback loop on cost.
Using multiple models to balance cost, speed, and complexity
Because the SERHANT. S.MPLE team was not spending its time rebuilding infrastructure or maintaining one-off AI integrations, they could shift their attention to testing models against real product tasks and choosing the right tool for each job:
Claude Sonnet for complex, accuracy-critical analysis like comparative market analysis, where strong structured-data reasoning matters
Claude Haiku for lightweight intent and field-filling tasks where speed matters
OpenAI models for conversational voice and general chat behaviors
Gemini for image generation, browser automation, and computer-use workflows where reliability and speed are the priority
They are also experimenting with “models as guardrails” to validate or critique outputs, and with caching strategies to rein in token spend as usage grows.
Worry-free scale: Adding users and assets
The value of their stack decisions became clear when S.MPLE launched publicly. "We moved from being an internal pilot program to more than 900 users without a lot of worry on infrastructure or scale," Bunting says. The API layer didn't require a single change, and Fluid compute handled the increase in workloads automatically.
That seamless scale matters because SERHANT. operates at a content generation pace that would break most systems. "SERHANT. generates about 35% more content than the top five brokerages combined," Bunting notes. Between property videos, listing descriptions, marketing materials, and now AI-generated assets, the volume is staggering.
Greg Parsons, Technical Director on the S.MPLE team, said that AI Gateway gives him visibility across their platform that wasn’t possible before. "We can gain insight into all of the disparate applications we are building across the business," Parsons explained.
What’s next: from linear workflows to conversational AI agents
S.MPLE began with linear workflows: real estate agents would trigger a single action, it would run end-to-end then return the result.
But real-world workflows are more complex and users want to execute multiple tasks in a single run, like producing all of the assets needed to market a property listing. Bunting’s team is now building toward conversational experiences where humans can run agents, steer and correct mid-flight, and combine multiple “recipes” into a single request.
It is a shift from one-off automations to a coordinated network of specialized agents, built to evolve as fast as the AI ecosystem itself.
Future-proofing an unpredictable landscape
Greg Chan, SERHANT.’s CTO, sees flexibility as the point. "In AI, things are evolving fast. What it looks like now is different than even three-to-six months ago. And it’ll be different months from now," Chan says.
For Chan, the win is that the team can keep building inside the ecosystem instead of rewriting the stack every time the world changes. "The last thing we want is to rebuild our stack every time a new model drops," he said.
About SERHANT.
SERHANT. is an AI-native real estate and media company, and is the most-followed real estate brand in the world.
Founded in 2020 by top real estate broker and entrepreneur Ryan Serhant, SERHANT. brings together brokerage, media, and education, with proprietary technology to revolutionize how properties are marketed, sold, and experienced.
SERHANT. sells residential, commercial, luxury, and new development properties nationally through its specialized divisions, including SERHANT. Signature for high-net-worth clients and SERHANT. New Development, which delivers end-to-end branding, marketing, and sales for ground-up residential projects.
Powered by S.MPLE, SERHANT.’s proprietary AI platform, agents are empowered with real-time data and workflow automation across listings, transactions, and marketing to deliver faster, smarter, and more impactful results while saving time. Award-winning SERHANT. Studios produces original content across social and streaming platforms, while SellIt.com is the company’s digital education hub, engaging members globally in more than 130 countries.
Learn more at serhant.com.
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み