FLORAがVercelのAIスタックでクリエイティブエージェントを実装した方法
FLORA は Vercel AI Stack の採用により、複雑なインフラ設定を排除し、クリエイティブのアイデアから画像生成までを自律的に実行する「FAUNA」というエージェントを短期間で実装・展開した。
キーポイント
FAUNA エージェントの登場と機能
従来のノードベースのワークフローキャンバスから進化し、ユーザーがアイデアを伝えるだけで参照画像の選定やモデル選択、バリエーション生成を自動で行う自律型クリエイティブエージェント「FAUNA」を発表。
Vercel AI Stack への移行とインフラ簡素化
LangChain や Temporal の併用による複雑なインフラ管理から脱却し、AI SDK と Workflow SDK(DurableAgent)を活用することで、並列処理や永続的なオーケストレーションをシンプルに実装。
クリエイティブプロセスの効率化
画像生成には数分かかるため、異なる角度や背景、モデルプロバイダーを同時に試す必要があるが、Vercel のアーキテクチャによりこれらを統合し、一貫した探索パスを提供可能に。
開発チームの課題解決
AI 技術の設定に時間を費やすという従来の課題に対し、Vercel のプリミティブを活用することで、製品自体のイテレーションにリソースを集中させることに成功した。
統合された AI スタックによる堅牢なオーケストレーション
Workflow SDK の DurableAgent と Fluid compute を組み合わせることで、状態を維持しながら並列かつ長期間のタスク(画像生成など)を効率的に実行可能にした。
クリエイティブワークにおける「プロセスこそが製品」
FAUNA の構築を通じて、ユーザーの深い理解を得ており、フロー状態を維持できる時間が長いほど成果が高まるという知見が得られた。
インフラの制約なく最新モデルを活用可能に
新しい画像モデルや機能が毎週登場する中、FLORA は基盤整備の負担なしにこれらの新機能を即座に取り入れることができるようになった。
影響分析・編集コメントを表示
影響分析
この記事は、AI エージェントが単なるテキスト処理から、複雑で並列性の高い視覚的クリエイティブワークフローへと進化していることを示す重要な事例です。特に、Vercel のようなモダンなインフラストラクチャが、開発者が技術的な負債(インフラ管理)に悩まされることなく、ビジネス価値の核心である「創造性」に集中できる環境を提供する可能性を証明しています。
編集コメント
クリエイティブ分野における AI エージェントの実装において、インフラの複雑さが最大のボトルネックとなるケースが多く見られますが、本記事はその課題を解決する具体的なアーキテクチャと成果を示しており、開発者にとって非常に示唆に富んでいます。
タイトル: FLORA、VercelのAIスタックでクリエイティブエージェントを構築した方法
Vercel上のFLORA
生成システムにより、本番環境への展開が2倍高速に
移行後、インフラに関する議論は不要に
50以上の画像モデルをオーケストレーション
季節のファッションローンチは、単なる一枚の画像ではなく、一つの物語です。
その物語を紡ぐことは、探求のプロセスです。同じ一着を、異なるモデルが着る。同じポーズを、異なる光と角度で捉える。同じセットで、背景を光沢のあるものから粗い質感のものへと変えていく。
FLORAは、このような視覚的な試行錯誤を、デジタルキャンバスを通じて誰もが行えるようにするために生まれました。彼らの新しいクリエイティブエージェント「FAUNA」は、デザインパートナーのように振る舞い、アイデアをクリエイティブな方向性の地図へと変換します。
FLORAからFAUNAへ:クリエイティブエージェントの誕生
FLORAは当初、ノードベースのクリエイティブワークフローキャンバスとしてスタートしました。上級ユーザーにとって、このキャンバスは強力なツールでした。ステップや分岐を作成し、各段階で詳細なプロンプトを追加することで、画像のあらゆる細部を磨き上げることができたのです。
しかし、このキャンバスには代償もありました。それは、すべてのクリエイターにワークフローデザイナーのような考え方を求めることでした。探求の各段階をプロンプトやモデル選択で設定する必要があり、クリエイティブなプロセスが中断されてしまったのです。
そこで彼らが開発したのが、FAUNAです。
このエージェントは、設定の負担を取り除きながら、AIの全機能を保持します。デザイナーは、真っ白なキャンバスと大量のサンプル画像から始める代わりに、自分のアイデアそのものからスタートできます。ユーザーがキャンペーン用ビジュアル、ムードボード、ルックブックの方向性など、作りたいものをFAUNAに伝えると、エージェントはリファレンスを収集し、モデルを選択し、自動的にバリエーションを生成して、探求と洗練を進めてくれます。
内部では、FAUNAは長時間動作する高度に並列なエージェントです。FLORAの応用AI責任者、Alec Joが開発を主導しました。
AlecとチームがFAUNAを構築している間、彼らは初期のキャンバスユーザーと同じ課題に直面し、エージェント自体の改善ではなく、AI技術の設定に多くの時間を費やしていました。そのとき、彼らはVercelの利用を検討し始めたのです。
インフラがエージェントを形作る
もしあなたがAIを主にテキストベースのタスクに使っているなら、プロのクリエイターが求める視覚的ワークフローの追加要件を過小評価しがちかもしれません。
画像や動画の生成には数分かかることもあり、単一のクリエイティブセッションからは、多くの並列ジョブが派生します。異なる角度、背景、スタイリングの方向性、モデルプロバイダー、そして「もしも」の分岐などです。
これらのジョブは同時に実行され、異なる時間に完了しますが、それでもユーザーが辿れる一貫した探求の道筋として統合される必要があります。
初期段階で、AlecのチームはエージェントプリミティブにLangChainのビルディングブロックを、オーケストレーションにTemporalを検討して使用していました。これは機能しましたが、代償を伴いました。維持管理すべきシステムが2つ、同期を保つ必要のある抽象化レイヤーが2セット、そして製品を動かし続けるための過剰なAI関連の「配管」作業です。
FLORAは、エージェントの構築とデプロイを簡素化するため、Vercel AIスタックへ移行しました。
- AI SDKとそのエージェントフレームワークは、FAUNAの動作(モデル、ツール呼び出し、エージェントロジックのインターフェース層)を駆動する、すぐに使えるプリミティブを提供します。
- Workflow SDKのDurableAgentは、AI SDKのエージェントフレームワークに耐久性のあるオーケストレーションを追加します。これにより、ループ内の各ステップが永続化され、失敗時には再試行され、状態を失うことなく任意の長さの時間実行できるようになります。
- Fluid computeは、エージェントが多くの並列タスクに分岐する際に、ジョブをコスト効率よく実行します。これは、並列で長時間実行される画像生成にとって極めて重要です。
目的は、単にツールを置き換えて簡素化することではありませんでした。プリミティブ、オーケストレーション、コンピュートが個別のコンポーネントではなく、一つのシステムとして連携するように設計された、統合された単一のAIスタックへ移行することにあったのです。
プロセスこそがプロダクトである
FLORAの究極の目標は、UI/UX以外のあらゆるデザイン作業をサポートすることです。FAUNAは、視覚的なアイデア創出をエンドツーエンドでオーケストレーションする彼らの第一歩となります。
しかし、FAUNAの構築は、Alecのチームに予期せぬ影響をもたらしました。それは、ユーザーをより深いレベルで理解する手助けとなったのです。クリエイティブな仕事においては、プロセスこそがプロダクトです。そして、フロー状態を長く維持できれば、その結果はより良いものになります。
新しい視覚的アイデアが新たな試行錯誤のサイクルを必要とするように、新しい画像モデルや機能は毎週のように登場します。今、FLORAは「配管」作業やインフラの障害に邪魔されることなく、それらを活用できるようになりました。
詳細を読む
原文を表示
FLORA on Vercel
2x faster to production with their generation system
Zero infrastructure debates after migration
50+ image models orchestrated
A seasonal fashion launch is a story, not a single frame.
Crafting that story is a process of exploration: It’s the same piece, worn by different models. The same pose, with different lighting and angles. The same set, with a background that shifts from glossy to gritty.
FLORA was built to make that kind of visual iteration available to anyone through a digital canvas. Their new creative agent FAUNA acts like a design partner, turning ideas into a map of creative directions.
From FLORA to FAUNA: a creative agent
Flora started as a node-based creative workflow canvas. For advanced users, that canvas is powerful: you can create steps and branches, adding detailed prompts at each stage to hone every detail of the images.
But the canvas also came with a tradeoff: it asked every creative to think like a workflow designer. You had to configure each state of an exploration with prompts and model choices, interrupting the creative process.
That’s why they built FAUNA.
The agent removes the setup burden, but keeps the full power of AI. Instead of starting with a blank canvas and a pile of example images, designers can start with their ideas. Users tell FAUNA what they want to create, like a campaign visuals, moodboards, or a lookbook direction, and the agent will pull references, choose models, and automatically generate variations to explore and refine.
Under the hood, FAUNA is a long-running, highly parallel agent. Alec Jo, Head of Applied AI at FLORA, leads the effort.
As Alec and his team were building it, they faced the same pain as their early canvas users, spending too much time configuring AI tech instead of iterating on the agent itself. That's when they started exploring Vercel.
Infrastructure makes the agent
If you use AI mainly for text-based tasks, it's easy to underestimate the additional demands of visual workflows for professional creatives.
Image and video generations can take minutes, and a single creative session can fan out into many concurrent jobs: different angles, backgrounds, styling directions, model providers, and “what if” branches.
Those jobs need to run simultaneously, will finish at different times, and still need to roll up into a coherent exploration path the user can navigate.
Early on, Alec's team used LangChain building blocks for agent primitives and considered Temporal for orchestration. It worked, but it came with a cost: two separate systems to maintain, two sets of abstractions to keep in sync, and too much AI plumbing to keep the product moving.
FLORA migrated to the Vercel AI Stack to simplify building and deploying their agent:
AI SDK and its agent framework provides out-of-the-box primitives that power FAUNA's behavior (models, tool calling, and the interface layer for agent logic).
Workflow SDK’s DurableAgent adds durable orchestration to AI SDK's agent framework, so each step in the loop persists, retries on failure, and can run for any length of time without losing state.
Fluid compute runs jobs cost-efficiently as the agent fans out into many concurrent tasks, which is critical for parallel, long-running image generations.
The point wasn’t just swapping tools for simplicity. It was moving to a single, integrated AI stack where the primitives, orchestration, and compute are designed to work as a system, not individual components.
The process is the product
FLORA's ultimate goal is to support all design work that isn’t UI/UX, and FAUNA is their first step in orchestrating visual ideation end-to-end.
But building FAUNA had an unexpected impact on Alec's team: it helped understand their users on a deeper level. In creative work, the process is the product. And the longer you can maintain a flow state, the better the outcome.
Just like new visual ideas require new cycles of iteration, new image models and capabilities launch every week, and now FLORA can take advantage of them without plumbing or infrastructure getting in the way.
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み