なぜ Codex は「Codex Design」のような製品をまだ推出していないのか?
宝玉は、開発支援ツール「Codex」がデザイン分野に対応した類似製品をまだ展開していない理由について疑問を呈している。
キーポイント
製品機能の領域限定性
現在の Codex は主にコード生成に特化しており、デザイン分野への直接的な対応は行われていない現状が指摘されている。
市場からの疑問提起
開発者やデザイナーの視点から、なぜ同様の強力な AI 支援ツールがデザイン領域で展開されていないのかという疑問が投げかけられている。
今後の製品戦略への期待
記事は Codex の開発チームに対し、デザイン分野における類似製品の登場や機能拡張の可能性について考察を求めている。
影響分析・編集コメントを表示
影響分析
この記事は、特定の AI ツール(Codex)の機能範囲に対するユーザーの期待と現状のギャップを浮き彫りにしており、AI ツールの分野横断的な展開に関する市場の関心を示しています。しかし、具体的な技術的進展や新製品の発表を伴うものではないため、業界全体への即時的な影響は限定的です。
編集コメント
本記事は特定の製品機能に関する疑問提起であり、具体的な技術的進歩や新発表を伴うものではありません。業界の関心動向を示す参考情報として捉えるべきです。
なぜ Codex はまだ Codex Design のような製品を推出さないのか?
Anthropic 社は最近、Claude Design をリリースしました。これはプログラミング以外で私が最も頻繁に利用するエージェントであり、何度も推奨しています。その効果は本当に素晴らしく、一言で欲しいアプリの要望を伝えるだけで、即座に対話可能なプロトタイプを生成してくれます。どこをクリックしても反応があり、よく見ないと本物のアプリを操作しているのかと錯覚してしまうほどです。
あるネットユーザーが質問しました。「なぜ Codex はまだ Codex Design のような製品を推出さないのですか?」
簡単に言えば、GPT-5.5 のモデル能力はまだこのタスクを完璧にこなすには至っていないからです。しかし、その理由を明確に説明するためには、まず重要な区別を理解する必要があります。
【1】エージェントの二層構造:モデルとハーネス
多くの人々が Codex、Claude Design と GPT-5.5、Claude Opus 4.8 を混同して語っていますが、実はこれらは全く異なる二つの層に属します。
Claude Design と Codex は「製品層」であり、業界ではハーネス(Harness)と呼ばれます。ここにはプロンプト、ツールチェーン、UI 交互フローといったエンジニアリング的な要素が含まれています。一方、Claude Opus 4.8 と GPT-5.5 は「モデル層」に属し、実際に作業を行う脳そのものです。
例えてみましょう:ハーネスは台所のようなもので、そこには鍋やフライパン(ツール)とレシピ(スキル)が揃っています。そしてモデルはその料理人です。同じ台所でも、料理人が変われば出来上がる料理は全く異なります。

この区別を理解すれば、その後の話もスムーズになります。
【2】ハーネスは参入障壁ではない
Claude Design のハーネス層における技術的難易度は高くありません。少し時間をかけて逆解析を行えば、プロンプトやツールコードのほとんどを入手可能です。実際に私も試しており、その成果物は baoyu-design(https://github.com/JimLiu/baoyu-design)で公開されています。これを利用すれば、Claude Design を他のモデル上でも実行することが可能になります。エンジニアリング面において秘密はありません。
真に差をつけるのは、その背後にあるモデルです。
【3】高精度な対話型プロトタイプ作成の難しさはモデルにある
「Claude Design」という名称は誤解を招きやすく、Figma や Photoshop のような静的なデザイン図が納品されると思われがちです。しかし実際には、Figma をさらに一歩進めた、デザイン稿とプロトタイプを融合させた高精度な対話型プロトタイプが提供されます。単にデザインを見るだけでなく、実際に操作もできるのです。
これはモデルに対して非常に高い要求を課します。
具体例を挙げましょう。X(旧 Twitter)や微博のようなクライアントアプリを作りたい場合を考えます。美しい静的なインターフェースを描画させることなら、多くのモデルで可能です。しかし、そのインターフェースを対話可能にするとなると話は複雑になります。異なるタイムラインへの切り替え、テキスト・画像・動画など様々な種類の投稿の表示、いいねボタンがハートマークに変わる動作、投稿削除時にリストから消える挙動、リストから詳細ページへ遷移して戻る操作、そしてこれらの状態を維持することまで含めなければなりません。
これらを実現するためには、モデルは UI を描画する前に、まずデータ構造とステータス管理の全体像を明確に把握している必要があります。投稿(tweet)はどのような形状か、タイムラインにはどのような種類があるか、各ボタンが現在どの状態にあるか、そしてそれらの状態間がどのように連動するかです。これはシステムアーキテクチャ設計の業務であり、単に UI を描画する作業ではありません。

Claude Design がモデルに求めるのは、優れた UI/UX デザイン能力とシステムアーキテクチャ設計能力の両方です。どちらかが欠けても効果が大幅に低下します。そのため私は以前、純粋な HTML でのデザイン稿作成に反対しました。あれは静的な UI デザインに過ぎず、UX(ユーザーエクスペリエンス)のインタラクションが融合されていないからです。
可能であれば自分でテストして体感してみてください。例えば以下のプロンプトを使います:
Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots
同じプロンプトを Codex に実行させても、ある程度の成果物は得られます。見られ、簡単なインタラクションも可能です。しかし比較すれば明確な差がわかります:リストはスクロールできますが、サイドバー(sidebar)はクリックできません;いいねボタンには反応がありません。数回の反復を経てようやく、まあまあのレベルに達するのです。
Claude Design が作り出すものは全く異なります。タイムラインから通知ページへ切り替えたり、リストから詳細画面へ進んで戻ったりしても、全体が滑らかで状態も維持されます。よく見なければ、完成度の高いアプリを操作しているかと思うほどです(データはすべて模擬のものですが)。
Claude Opus 4.8 は明らかに、デザインやアーキテクチャといったシナリオにおいて大量のトレーニングと最適化を行なっています。
【4】産出品がそのままコード
Claude Design の産出品を見てみましょう。特に data.jsx ファイルに注目してください。ここでは全体のデータ構造定義が非常に明確に行われており、この構造に基づいて一連の完全な模擬データを構築し、React を用いてそのデータ上で UI を構築しています。
設計の成果物自体がコード(React、CSS、JSON)であり、Figma や PSD ではありません。どんな開発者でも手に取れば、ボタンの角丸、メインカラー、間隔などを即座に把握でき、自らの技術スタックに合わせて実装できます。後からデザイン変更があった場合も、git diff を見れば何が変わったか一目でわかります。設計と開発の間のコミュニケーションコストは最小限まで抑えられています。

厳密に言えば、設計用エージェントと開発用エージェントの間のコミュニケーションコストが低減した、というべきでしょう。現在は人がエージェントを指揮してデザインを行い、人がエージェントを指揮してコードを書くのです。
【5】Claude Design をどう活用するか
多くの人は Claude Design の活用法がわかりません。実はこれは Vibe コーディングに似ています:基本的なアイデアを持ち、まずバージョン 1 を作らせ、その後チャットでエージェントに指示を出して修正させます。数回のバージョン調整を行ううちに、自分の考えが明確になっていきます。
この調整プロセスは非常に不思議で、「言わば即座に実現される」という感覚があります。どのように変更してほしいか伝えれば、必ず実現してくれます。だからこそ私は現在、Claude Design を熱心に使い込んでいます。フィードバックの速さと爽快感がたまりません。
もう一つのコツ:あまり具体的な要求をせず、自分が目指す目標だけを伝えて、自由に任せることです。そうすると往々にしてより良い結果が得られます。なぜなら、あらゆる一般的な UI デザインについてトレーニング済みだからです。
最初の質問に戻りましょう。Codex が類似のデザイン製品を出さないのは、GPT-5.5 がまだこのタスクを担いきれていないからです。美しいインターフェースを描くことは多くのモデルで可能ですが、難易度が高いのは、実際に手を動かす前にデータ構造や状態管理、インタラクションロジックをすべて明確に整理し、一度きりで完全な対話型プロトタイプを納品することです。
現在これを達成できているのは Claude のモデルだけです。どれほど先行できるかは、OpenAI や他社が今後どのような進化速度でモデルを進化させるかにかかっています。
原文を表示
为啥 Codex 还不推出类似 Codex Design 的产品?
Anthropic 最近推出了 Claude Design,是我除了编程之外用得最多的 Agent,也推荐过很多次。效果真的好:你用一句话描述想要的 App,它直接给你生成一个可交互的原型,点哪哪都有反应,不仔细看还以为在操作真实的 App。
有网友问:为啥 Codex 还不推出类似 Codex Design 的产品?
简单来说,GPT-5.5 的模型能力还做不好这件事。但要解释清楚为什么,得先理解一个关键区分。
【1】Agent 的两层:模型和 Harness
很多人把 Codex、Claude Design 和 GPT-5.5、Claude Opus 4.8 混在一起说,其实它们是完全不同的两层。
Claude Design 和 Codex 是"产品层",业界叫 Harness,包括提示词、工具链、UI 交互流程这些工程层面的东西。Claude Opus 4.8 和 GPT-5.5 是"模型层",是真正干活的大脑。
打个比方:Harness 是厨房,里面有锅碗瓢盆(工具)和菜谱(Skills),模型是厨师。同一套厨房,换个厨师,做出来的菜完全不一样。

理解了这个区分,后面的事情就好说了。
【2】Harness 不是门槛
Claude Design 的 Harness 层技术上不复杂。花点心思逆向一下,提示词、工具代码几乎都可以拿到。我已经做过了,成果在 baoyu-design(https://github.com/JimLiu/baoyu-design),可以借助 Skill 把 Claude Design 在其他模型上运行。工程上没秘密。
真正拉开差距的是背后的模型。
【3】高精度可交互原型,难在模型
Claude Design 这个名字容易让人误解,以为交付的是 Figma、Photoshop 那样的静态设计图。实际上它交付的比 Figma 更进一步,是融合了设计稿和原型的高精度可交互原型:你不光能看到设计,还能直接上手操作。
这对模型的要求很高。
举个例子。我要做一个类似 X/微博的客户端。让模型画一个好看的静态界面,很多模型都做得到。但要让这个界面能交互就复杂了:切换不同 Timeline,展示不同类型的推文(文本、图片、视频),点赞要变红心,删推要从列表消失,从列表点进详情再返回,状态还要保持住。
要做到这些,模型必须在动手画 UI 之前,先把整套数据结构和状态管理想清楚:tweet 长什么样、timeline 有哪几种、每个按钮当前是什么状态、状态之间怎么联动。这是系统架构设计的活,不是画 UI 的活。

Claude Design 对模型的要求,是同时具备优秀的 UI/UX 设计能力和系统架构设计能力,缺一个效果就大打折扣。这也是为什么我之前反对只产出纯 HTML 的设计稿,那只是静态的 UI 设计,没有融合 UX 交互。
有条件的话可以自己测试感受一下。比如用这个提示词:
Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots
同样的提示词让 Codex 去做,也能出个东西,能看,也能简单交互。但对比一下就知道差距了:列表能滚动,sidebar 不能点;点赞按钮没反应。来回迭代好几轮,才能达到一个勉强凑合的水平。
Claude Design 做出来完全不一样。从 Timeline 切到通知页,从列表点进详情再返回,全程流畅,状态都保持住了。不仔细看真以为在操作一个完成度很高的 App,虽然数据都是模拟的。
Claude Opus 4.8 显然在设计和架构这类场景上做了大量训练和优化。
【4】产出物就是代码
去看 Claude Design 的产出物,注意里面的 data.jsx 文件。它把整个设计的数据结构定义得很清晰,基于这个结构模拟了一套完整数据,然后用 React 在这套数据上构建 UI。
设计产物本身就是代码(React、CSS、JSON),不是 Figma 或 PSD,任何开发者拿到都能直接看出按钮的圆角、主色、间距,照着自己的技术栈实现就行。后续设计变更?git diff 一看就知道改了什么。设计和开发之间的沟通损耗降到了最低。

说得不严谨,应该说设计 Agent 和开发 Agent 之间的沟通损耗很低了。现在都是人在指挥 Agent 去设计,人指挥 Agent 写代码了。
【5】怎么用好 Claude Design
很多人不知道该怎么用好 Claude Design,其实有点像 Vibe Coding:有个基本的想法,先让它做一个版本出来,然后通过 Chat 去指挥 Agent 帮你改,调整几个版本你的思路就清晰了。
整个调整的过程非常神奇,有一种"言出法随"的感觉,你想让它怎么改它总能给你实现出来。这也是为啥我现在很痴迷用 Claude Design,反馈来得太快太过瘾了。
还有一个小技巧:不要说太具体的要求,而是说你的目标是想要什么,让它自由发挥。往往能得到更好的效果,毕竟它训练过几乎所有公共的 UI 设计。
回到最初的问题。Codex 不推类似的设计产品,是因为 GPT-5.5 还扛不住这个活。画个好看的界面很多模型都行,难的是在动手之前把数据结构、状态管理、交互逻辑都想清楚,然后一次性交付一个完整的可交互原型。
目前只有 Claude 的模型做到了。至于能领先多久,就看 OpenAI 或者其他家后面模型的进化速度了。
関連記事
OpenAI Codex を活用した 5 つの楽しいプロジェクト
KDnuggets が紹介する記事では、OpenAI のコード生成モデル「Codex」を実際に使用して作成された 5 つの興味深いプロジェクト事例が紹介されています。
Salesforce CodeGen チュートリアル:ユニットテストと安全性チェック付きの Python 関数の生成・検証・再ランク付け
Salesforce は Hugging Face からモデルを読み込み、自然言語から Python 関数を生成するエンドツーエンドワークフローを公開した。この手法には構文チェックや静的解析、ユニットテストによる検証が含まれる。
Mistral AI が Vibe にコード作成とアプリ機能を提供へ
AI 企業「Mistral AI」は、開発者向けプラットフォーム「Vibe」にコード生成およびアプリケーション構築機能を追加すると発表した。これにより、ユーザーは Vibe 上で直接コード作成やアプリ開発が可能になる。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み