OpenAI社長グレッグ・ブロックマン:AIの自己改善、スーパーアプリへの大賭博、AGIへの道、計算能力の拡張
OpenAIのGreg Brockmanは、Soraの中止と1100億ドル調達を背景に、SpudモデルとSuper Appへの集中投資でAGI達成を目指す戦略を語ったが、その技術的正当性と商業現実には矛盾が残る。
キーポイント
Sora中止と計算資源の集中戦略
ビデオ生成モデルSoraを停止し、GPT系列やエージェント基盤への計算リソース集中を選択。技術的分岐の正当性を強調する一方、ユーザー減少やDisney取引取消などの商業的止血要因は伏せた。
Super App構想とMicrosoftとの競合
ChatGPT、Codex、ブラウザを統合する「スーパーアプリ」の提供を目指すも、Microsoft 365 Copilotとの機能重複とパートナー兼競合という構造的矛盾を内在する。
次世代モデルSpudとAGI評価の矛盾
約2年の研究を集約したSpudの事前学習完了を報告し、AGI達成度を70-80%と評価するも、定義の曖昧さと数値化の矛盾を指摘され、具体的なベンチマーク指標は欠如している。
競合他社との技術・投資論争
Anthropicのコーディングツールでの一時遅れを認めた上で追従を主張し、Dario Amodeiのインフラ投資批判を否定するも、具体的な反論や収益予測に関する議論は避けた。
Codexの非エンジニア展開と「最後の1マイル」課題
OpenAIはCodexをSuper Appの核とし、Peter Steinberger氏の招聘で個人Agent分野に注力しているが、非エンジニア向けの使いやすさ向上は依然として大きな障壁となっている。
Anthropicとの競争と研究・実装の統合
Brockman氏はAnthropicに市場シェアで後れを取っていることを認める一方、モデル能力では追いついたと主張。最も重要な変化として、従来の「研究」と「製品化」を分離していた組織体制を統合し、開発初期から製品利用を想定する文化へ転換したことを明かした。
次世代モデル「Spud」と2025年12月の能力急増
Spudはベンチマーク数値より定性評価(big model smell)を重視し、2025年12月のアップデートでAIのタスク遂行率が20%から80%へ非線形に跳躍。これによりAIは「おまけ」から「業務フロー再構築の必須要素」へと位置づけが変わった。
影響分析・編集コメントを表示
影響分析
本記事はOpenAIの巨額調達と戦略転換が、単なる技術最適化ではなく計算資源のゼロサム競争であることを浮き彫りにした。Super Appと次世代モデルへの集中は業界の標準化を加速させる一方、Microsoftとの競合激化やAnthropicとの技術差縮小が今後のAI市場の再編を促す可能性がある。
編集コメント
Brockmanの戦略は計算資源の集中という合理的な選択を示すが、Sora中止の商業的背景やSuper Appの実装課題を軽視している懸念がある。今後のSpudモデルのベンチマーク公開とSuper Appの実装進捗が、OpenAIのAGI戦略の真価を測る鍵となる。
Greg Brockman が Big Technology Podcast のスタジオに座った時、OpenAI はちょうど三つの大きな出来事を成し遂げていました:Sora を廃止すること、1,100 億ドルの資金調達を受けること、そして次世代モデル Spud の事前トレーニングを完了することです。スター製品の一つを切り捨て、巨額の資金を獲得し、新しいモデルに賭けるという三つの出来事が同時に起こり、それぞれに説明が必要でした。続く 90 分間で、この OpenAI の共同創設者兼社長は、高難易度の任務を遂行します:一見受動的に見える決定をすべて、先見的な戦略的選択として再構築することです。
彼はそれを成し得たのでしょうか?大部分の場面で成功しましたが、その物語の隙間には、注意深く見るに値するいくつかの手がかりが隠されています。
Brockman は過去 18 ヶ月間、主に会社の「規模(Scale)」部門を統括しており、GPU インフラストラクチャ、データセンター、サプライチェーンを担当しています。今回のインタビューで扱われた話題の範囲は極めて広大です:Sora がなぜ廃止されたのかから、Super App の姿、次世代モデルが何を実現できるか、1,100 億ドルをどのように使うか、そして彼が MAGA Inc. に 2,500 万ドルを寄付した理由に至るまで。

オリジナル動画:https://www.youtube.com/watch?v=J6vYvk7R190
Sora の廃止は「技術の核心への集中」なのか、それとも損失の拡大防止(止血)なのか。Brockman は Sora と GPT が技術樹(Technology Tree)上の異なる枝であり、限られた計算資源を考慮すればどちらか一方を選ばざるを得ないと説明します。しかし、Sora の日次コストが数百万ドルに達し、ユーザー数が 50 万人を下回っているという現実については言及していません。
Super App は、ChatGPT、プログラミングエージェント Codex、ブラウザ Atlas を一つの統合アプリケーションに統合するもので、今後数ヶ月以内に提供される見込みです。しかし、このビジョンは Microsoft 365 Copilot と直接的な重複があり、インタビューの中でこの点について問われることはありませんでした。
次世代モデル Spud は約二年間の研究の成果を凝縮したものであり、Brockman はこれが AI の能力の天井と床の両方を同時に引き上げると述べていますが、その能力に関する記述はすべて感情的な表現に留まり、具体的な数値指標はありません。
AGI(人工汎用知能)への進捗を自己評価で 70-80% と評していますが、Brockman は同時に AGI の定義が「むしろ一種の雰囲気のようなもの」であり、精確に定義できないものをどのように精確に定量化できるのかという矛盾について言及していません。
プログラミングツールの「最後の一段階(ラストワンマイル)における可用性」において Anthropic に遅れをとっていたことを認めつつ、現在は追いついたと主張しています。しかし、サードパーティのデータでは Anthropic の企業市場シェアが依然として急速に拡大していることが示されています。
Anthropic CEO の Dario Amodei 氏が OpenAI のインフラ投資を「過度に攻撃的(過剰)」だと批判したことに対し、「同意しない」と応答しましたが、Amodei 氏による「収益予測の誤差が一年でも生じれば破綻する」という具体的な論証については言及していません。
Sora の廃止:技術的な選択か、それとも商業的な損失拡大防止か?
Kantrowitz が冒頭で問いかけます:OpenAI は消費者市場で先行しているのに、なぜ突然リソースを動画生成から転換させたのか?
Brockman が提示した説明の枠組みは、世間の推測とはかなり異なっています。彼は Sora のモデルと GPT シリーズが「技術樹上で全く異なる枝」であり、構築方法も根本的に違うと述べます。計算資源が限られた世界において、二つの技術ルートを同時に推進することは莫大な代償を伴うのです。彼はベクトルの比喩を用いました:
ランダムなベクトルの和はゼロになるが、方向を揃えれば前進できる。
力が分散すれば互いに相殺し合い、集中することで運動エネルギーが生み出される。彼によれば、深層学習分野における問題とは機会不足ではなく、むしろ機会が多すぎることであり、投資を分散させることはどの方向にも遠くまで到達できないことを意味します。
この説明は技術的な論理としては整合していますが、物語の半分しか語っていません。WSJ の調査と TechCrunch の報道によると、Sora は商業的には失敗しており、ユーザー数はピーク時の 100 万人からわずか数ヶ月で 50 万人未満に急落し、毎日約 100 万ドルの計算リソースコストを燃費しています。WSJ の報道によれば、ディズニーが Sora に 10 億ドルを投資し、キャラクターのライセンス権限を与えるという取引もキャンセルされましたが、ディズニーは公式発表のわずか 1 時間前までその事実を知りませんでした。Sora を停止させた背景には、技術的な焦点を絞る論理だけでなく、ビジネス上の出血を止める現実的な圧力もありましたが、Brockman は前者のみについて語りました。
彼はこれは「消費者向けから企業向けへ移行する」ことではなく、「選択を迫られる」ことだと強調しました。彼が現在最も重要な 2 つの応用分野と考えるのは、ユーザーを理解し目標に合致するパーソナルアシスタントと、困難な課題を解決してくれる AI です。これら 2 つのことだけでも、OpenAI が現在保有している計算リソースでは足りません。
技術的な詳細として、ChatGPT 内の画像生成機能は影響を受けません。画像生成は GPT アーキテクチャに基づいており、テキストや音声と同じ技術ルートを共有しています。一方、Sora は拡散モデル(diffusion model)を使用しており、これは別の技術体系に属するものです。Sora の研究チームが解散したわけではなく、ロボット分野における世界シミュレーション研究へと転換しました。
Kantrowitz はさらに質問しました。Google DeepMind の Demis Hassabis は、AGI に最も近いのはテキストモデルではなく画像生成器だと考えています。なぜなら、物体間の相互作用や世界の仕組みを理解しなければならないからです。OpenAI がこの路線を放棄することは、誤ったレーンに賭けることにならないでしょうか?
Brockman はこれは現実的なリスクであると答えました。「もちろんそうです。この分野では選択を迫られ、賭けに出る必要があります。」しかし、彼は続けて、OpenAI に自信がある理由は「AGI への道筋を見たから」だと述べました。彼が挙げた例とは、ある物理学者が長年未解決だった問題を OpenAI のモデルに投げかけたところ、12 時間後に解答を得て、「初めて AI が『思考』していると感じた」と語ったというものです。ただし Brockman はその物理学者の名前や具体的な問題については明かさず、この事例は独立して検証することはできません。【注:公開情報において、数学者の Terence Tao は 2026 年 3 月に ChatGPT Pro が核心証明を担当した論文を発表しましたが、これは数学分野に属するものであり、ここで述べられている内容と直接対応するものではありません。】

スーパーアプリ:壮大なビジョンだが、マイクロソフトの問いに誰が答えるのか?
動画生成機能を削除したことで、OpenAI は賭けを別の方向へ向けました。Kantrowitz がスーパーアプリとは何かと問うと、Brockman は ChatGPT(チャット)、Codex(プログラミングエージェント)、そしてブラウザを 1 つのアプリケーションに統合するものだと答えました。
コンピュータは人間に合わせて動くべきであり、人間がコンピュータに合わせて動くべきではありません。
彼はスーパーアプリをノートパソコンに例えました。あなたのノートパソコンは私用ですか、それとも業務用ですか?両方です。スーパーアプリも同様で、パーソナルアシスタントであると同時に仕事道具でもあります。個人利用の場面には、ChatGPT が現在持つすべての用途に加え、より深い記憶力と文脈理解能力が加わります。ChatGPT 内にはすでに「Pulse」と呼ばれる機能(パーソナライズされたコンテンツ配信)があり、AI がユーザーについて学習した内容に基づいて毎日コンテンツを配信しています。
しかし Brockman は、ユーザーが目にするインターフェースは「氷山の一角」に過ぎないと述べました。より重要なのは基盤となる技術の統一です。過去 2 年間の AI の発展は、「モデルだけを見る」ことから「システム全体を見る」へと変化しました。つまり、モデルがどのように文脈を取得し、外部世界とどう接続し、どのような操作を実行できるかという点です。これらについては OpenAI 内部でも複数の実装が存在しましたが、今後はそれらを一元化して、汎用的な「AI レイヤー」を形成します。通常の場合、ユーザーが金融 AI や法律 AI のような専門的な AI を個別に必要とするわけではありません。スーパーアプリで十分通用するのです。このビジョンが実現すれば、確かに AI 製品の形態そのものを再定義する可能性があります。
問題は、Microsoft 365 Copilot がすでにほぼ同じことを実行している点にあります。AI をワークフローに組み込み、統一された入口を提供し、さまざまなツールを接続しています。OpenAI は Microsoft のモデル供給元であると同時に、Microsoft と直接競合する製品も展開しようとしています。この緊張関係をどう解消するのか?Kantrowitz 氏はこれを問うておらず、Brockman 氏も当然ながら答えていません。さらに Sora が OpenAI の消費者向け製品の提供実績が必ずしも輝かしいものではないことを示したばかりであり、「数ヶ月以内の納品」というタイムラインには疑問符を付す必要があります。

Codex:プログラマーから一般ユーザーへ至る道はどれほど遠いのか
Super App の野望を実現するためには、Codex が重要なピースの一つとなります。当初はソフトウェアエンジニア向けに設計されましたが、OpenAI 内部ではすでに非エンジニアによる自発的な利用が多数見られます。Brockman 氏によれば、Codex の基盤となるのは二つの要素です。一つはツールを呼び出せる汎用エージェントフレームワーク(Agent Framework)、もう一つはコードを記述できる AI です。これに電子スプレッドシートや Word ドキュメントを接続することで、知識労働も可能になります。
具体的な事例として、Codex を使用して動画編集を行うケースがあります。AI 自身が Adobe Premiere のプラグインを作成し、自動で章分けを行いました。また、社内コミュニケーションチームは Codex を Slack やメールに連携させ、フィードバックを統合しました。これらの事例が事実であれば、AI が異なるツールをつなぐ「万能の接着剤」としての能力が形成されつつあることを示しています。ただし、これらはすべて Brockman 氏が口述した内部利用のシナリオであり、外部ユーザーによる検証は行われておらず、公開されているかどうかについても言及されていません。
Brockman 氏は、非プログラマーにとって現在の Codex の使いやすさは低いと指摘します。設定中にエラーが発生した場合、開発者なら対処法を知っていますが、一般ユーザーは途方に暮れてしまいます。しかし彼は、最も困難な部分(真に賢い AI を作り出すこと)はすでに完了したと考えており、残りの部分は「はるかに容易だ」と述べています。この判断が妥当かどうかは、「難しい」をどう定義するかによります。消費者向け製品に取り組んだ経験がある人にとって、「最後の 1 キロ」はそれまでの 99 キロよりも遥かに困難であることがよくあります。
また、OpenClaw の創設者 Peter Steinberger 氏が OpenAI に加入したことも言及しました。これは Codex を非プログラマー向けに拡張するシグナルです。Steinberger 氏はオーストリアの开发者で、2025 年末にメールの自主管理、食事注文、スマートホーム制御を可能にするオープンソースの AI エージェントを開発し、GitHub のスター数は 19.6 万、週次アクティブユーザーは 200 万人に達しました。2026 年 2 月、Altman 氏は彼が「次世代の個人エージェント」を担当すると発表しました。この役職自体が、OpenAI が「AI をプログラマーの枠組みから解放する」という課題を真剣に取り組んでいることを示しています。
Anthropic の追跡:後れを認めつつも、追い上げを宣言
Kantrowitz 氏は質問します。「Anthropic はすでに Claude チャット、Claude Cowork、Claude Code を提供しており、事実上独自の Super App を構築しました。OpenAI は Anthropic が行ったことを見て初めて気づいたのでしょうか?」
Brockman 氏は、OpenAI は過去にプログラミング分野で常に最良の競争成績を収めてきたと認めつつも、「最後の 1 キロにおける使いやすさ」への投資が不足していたと認めます。モデルはプログラミングコンテストでは非常に賢いですが、現実世界のごちゃごちゃしたコードベースにはまだ触れたことがありません。
約一年前の中頃、OpenAI はこの問題解決のために専任チームを編成しました。実際のコードベースに見られるさまざまな「雑多な作業」を研究し、奇妙な方法で中断される混乱したシナリオを模擬するトレーニング環境を構築したのです。彼は現在では追いついたと主張し、正面からの比較においてユーザーは OpenAI をより好む傾向にあるとしています。しかし同時に、フロントエンドの体験はまだ後れをとっていると認めています。
第三者のデータが示す状況は異なります。Synergy Research などの機関によると、Anthropic の企業市場シェアは 2023 年の低水準から 2025 年末には約 40% に上昇し、一方 OpenAI は 50% から約 27% へと低下しました。Claude Code はソフトウェアエンジニアの間で極めて高い評価を得ています。Brockman が「追いついた」と言った際、何を比較しているのか、モデルの能力なのか市場シェアなのか。彼は巧妙にも議論の場を前者に限定しました。
より大きな変化は社内において起こっています。Brockman によれば、OpenAI は過去に研究と実装を「ほぼ別々の事柄」として扱っていましたが、今後はこれらを一つのプロセスとして統合し、研究を行う段階から製品がどのように利用されるかを視野に入れる方針です。これはこの発言の中で最も実質的な情報量を含んだ一文であり、OpenAI のこれまでの組織体制には確かに問題があったことを示唆しています。

製品競争から社内文化へと視点を移し、Kantrowitz は別の角度から問いかけました。2022 年以来 OpenAI が一貫して先行してきたが、今や競争が激化する中で社内の雰囲気に変化はあるのかと。
Brockman はあるエピソードを語りました。ChatGPT の発表後の祝賀パーティーにおいて、会社全体に「我々は勝った」という空気が漂っているのを感じたそうです。それが彼にとって最も恐ろしい瞬間でした。
これはテクノロジー企業の経営者がよく使う標準的なレトリックです。時価総額 3000 億ドルの企業が挑戦者であるかのように自称し、かつて Google が自社のことをスタートアップだと宣言したのと似ています。信じるかどうかは読者の自由ですが、彼は続けてより実のある言葉を補足しました。「好調な時期には他人が言う自分の良さも信じすぎず、不調な時期にも他人が言う自分の悪さも過信してはいけない」と。
Spud:感覚としては合っているが、データはどこにある?
文化論の次は技術です。次世代モデルである Spud について、Brockman はそれが「約 2 年間にわたる研究成果を凝縮した新しい事前学習ベースモデル」であることを確認しました。
彼はまず思考の枠組みを修正しました。重要なのは特定のモデル一つではなく、全体としての「進歩のエンジン(engine of progress)」です。モデル開発は数段階に分かれます。まず大量のデータで基礎モデルを訓練する事前学習を行い、これが最もコストがかかる段階です。次に強化学習を通じて問題解決能力を高める後処理(post-training)を行います。最後に行動と可用性を調整します。Spud はこの新たな事前学習サイクルの結果であり、その後は大規模な後処理による最適化が待っています。
Spud が具体的に何ができるかについては、Brockman は数値指標を示していません。彼は「ビッグモデルの匂い(big model smell)」という概念を創り出しました。モデルが本当に強力になった時、その質感は「嗅ぎ取れる」ものだと。質問に対して逸脱した回答をせず、繰り返し説明する必要もないのです。Spud は天井(より開放的で時間跨度の長い問題への対応力)と床(日常タスクの実用性)の両方を同時に引き上げると言います。
ベンチマークスコアも競合との比較データも、具体的なタスクにおける実演データもありません。このような純粋に感覚的な記述は機密保持のためかもしれません。業界ではモデル発表前の保密が常態化しています。しかし、競合他社が頻繁にベンチマーク結果を公開する現状において、「感覚」だけで説得力を持つのは限定的です。OpenAI も以前 GPT-4 を発表した際、一部ベンチマークの詳細を意図的に避けましたが、その後の実際の製品パフォーマンスによって発言権を取り戻しました。Spud が同じ道筋をたどれるかどうかは、発表後の実力次第です。
2025 年 12 月:転換点の物語
Kantrowitz は問いました。「2025 年 12 月に何が起こったのか?プログラミングエージェントが理論から実践へと移行したように見えます」
Brockman によれば、その時のモデル発表により AI は「あなたのタスクの 20% をこなせる状態」から「80% をこなせる状態」へと飛躍しました。単なる「おまけ」から、「AI に合わせて業務フローを再構築しなければならない」という必須要素へと変化したのです。
彼は長年にわたる個人的なテストを共有しました。AI にウェブサイト作成を依頼したところ、かつてプログラミングを学んだ際に数ヶ月かけて作ったサイトを、2025 年の大半の期間では四五時間かけて複数回の対話を経て完成させる必要がありました。しかし 12 月には、プロンプト(指示)を一度与えるだけで完了しました。
ゆっくりと、ゆっくりと、そしてゆっくりと。その後、一瞬で全てが変わりました。
この表現はヘミングウェイの『太陽は再び昇る』から出たもので、原文では「どうやって破産したのか」という問いです。AI 能力の非線形的な成長を形容するには、まさにふさわしい言葉ですね。
もう一つの事例として、彼と密接に協力しているエンジニアがいます。このエンジニアは GPT-5.2 の時代には、基盤となるシステム工学において AI を全く活用できませんでした。しかし 5.3 になると、AI に設計ドキュメントを渡すだけで、コードの実装、監視指標の追加、パフォーマンス分析ツールの実行、そして自己最適化まで行い、最終的にエンジニアが求める成果物を生み出せるようになりました。
「GPT-5 の発表後、一般からの反応にはやや失望感があった」という点について、Brockman はこう述べています。どの製品発表にも二つのグループが存在します。一つは劇的な変化を実感する人々、もう一つは AI がボトルネックとならない用途で利用しているため、違いを感じられない人々です。真に重要なのは、人々が AI の能力に対するメンタルモデル(心的モデル)を更新する速度が、技術そのものの進化よりも遅いという事実です。
AGI:70-80% だが、定義は「雰囲気(Vibe)」
Nvidia CEO の黄仁勲氏は最近、「私たちはすでに AGI を実現したと考えている」と発言しました。Kantrowitz 氏が Brockman 氏にこれに同意するか尋ねると、Brockman 氏は AGI の定義は人によって異なるものだと答えました。現在の技術は「非常にばらつきがある(very jagged)」状態です。コーディングのようなタスクではすでに人間を超えていますが、人間が簡単にこなせる基本的なタスクのいくつかについては、AI はまだ苦手としています。どこに線を引くかという判断は、「科学というよりは、むしろ雰囲気や感覚に近いもの」だと言います。
彼自身による評価では、「70-80% まで到達した」としています。
この一見矛盾する表現は、業界全体が抱えるジレンマを反映しています。もし AGI の定義が科学ですらなく「雰囲気」に過ぎないなら、その 70-80% という数字はどうやって算出されたのでしょうか?誰もが、自分たちで正確に定義できない概念を数値化しようとしています。黄氏の AGI 定義は極めて狭く、彼自身も 10 万個の Agent を作っても Nvidia のような企業にはなれないと認めています。Lex Fridman 氏はかつて、「10 億ドル規模の会社を設立し運営できるか」を判断基準として提案しました。Brockman 氏は黄氏よりも慎重ですが、同じく定義というジレンマに陥っています。
彼は今後数年以内に AGI が実現すると考えており、AI はコンピュータ上で行う知的作業のほとんどをこなせるようになるでしょう。ただし、能力には依然としてばらつきがある状態が続くと述べています。
自動化 AI 研究員:AI で AI を加速させる
OpenAI は今年秋に、自動化された AI 研究員の導入を計画しています。
Brockman 氏は現在の段階を「離陸(takeoff)」と呼んでいます。この用語は AI セーフティの分野で特定の意味を持ち、AI が急速な再帰的自己改善フェーズに入ることを指します。彼がこの文脈でこの言葉を使っていることは、少なくともその重みを理解していることを示しています。彼の意図には二つの層があります。技術的には、AI 自体がより高度になるほど、自己改良を加速させるようになります。応用面では、チップメーカーが投資を拡大し、企業が各分野で AI アプリケーションの模索を進めており、すべてのエネルギーが蓄積されつつあるのです。
具体的には AI 研究員について、Brockman 氏は「OpenAI の研究科学者が行う一連のエンドツーエンドの作業全体を、シリコンチップ上で実行できるようにするもの」と定義しています。
しかし彼は、これは AI に丸投げして放任するということではないと強調しました。彼はその様子を、若手研究員を指導することに例えました。放っておくと、その研究員は役に立たない道に進んでしまうからです。上級研究員が方向性と審査を担当し、AI が実行役を務めるのです。
エージェント時代における人間の責任:外部化できない
Kantrowitz 氏は、Brockman 氏が以前述べた言葉を引用しました。「AI エージェントを使って作業を行うとき、あなたは数千の Agent からなる艦隊の CEO のようなものになります。彼らはあなたの目標とビジョンを遂行しますが、各タスクが具体的にどう解決されているかは理解できません。この新しい働き方は、問題に対する感覚(パルス感)を失ったように感じさせるかもしれません」という内容です。
Brockman 氏はこれは善悪両方の側面があるとし、重要なのは「強みを認め、弱みを軽減すること」だと答えました。AI エージェントは巨大なレバレッジをもたらしますが、最終的に責任を負うのは「一人の当事者」です。あなたの Agent がウェブサイトを壊してユーザーに迷惑をかけた場合、それは Agent のせいではなく、あなた自身の責任です。
Kantrowitz 氏は尋ねます。「しかし、『問題に対する感覚を失う』ことと『責任を持つ』ことはどう両立させるのですか?」
Brockman 氏はリフォームの例えを用いました。総工事に頼んで家を改装する場合、一部の細部については専門家を信頼しているため気にする必要はありません。しかし何か問題が起きた場合、そのことを知っておく必要があります。「盲目的に『もう何も関与しなくていい』と受け入れるべきではありません。自ら積極的に問題へのコントロールを維持する必要があります」と述べています。
1100 億ドルの計算資源への豪賭:収益の中核か、カジノのチップか?
技術的アプローチと製品ビジョンから、ビジネスの現実へと話を戻しましょう。
ブロクマンは計算資源を営業職員の採用に例えました。製品が売れ、スケーラブルな販売方法が存在する限り、営業員が多ければ多いほど収益は増えるという考え方です。計算資源はコストセンターではなく、収益センターであると彼は主張します。ChatGPT の発表当日の内部での会話について語りました。
「どれだけの計算資源を買うべきか?」「全部だ。」
「いやいや、本当にそう思うのか?」
「どうやって構築しようとも、需要には追いつかないとわかっている。」
彼はその後、毎年この判断が正しかったことが証明されたと述べています。現在の ChatGPT は週次アクティブユーザー数が 4 億人を超え、消費者向けサブスクリプションからの収益も継続的に増加しており、需要側の視点から見ればこの判断は確かに成立しています。しかし課題は、計算資源の調達には 18 か月から 24 ヶ月先を見越した事前ロックインが必要であり、未来を正確に予測しなければならない点にあります。
収益構造については、消費者向けサブスクリプションが依然として最大の源泉ですが、企業における知識労働分野での成長は極めて速いです。彼は将来の収益が単に「消費者」と「企業」の 2 つに分類されるものではないと考えており、むしろユーザーがデジタル世界への入口を一つ持つようなものであり、その入口から収益が発生すると捉えています。
カントロウィッツは、ダリオ・アモダイが特定の競合他社が「YOLO(人生一度きり)方式」で資金を燃やしており、「リスクのノブをやりすぎまで回している」と示唆したことに言及しました。
ブロクマンの返答はこうです。「私は同意しません。私たちは常に非常に慎重に行動し、このトレンドをいち早く察知して先手を打ってきました。」
しかし「私は同意しない」と述べた後、彼はアモダイの核心的な論点には応えていません。それは、「収益予測が 1 年ずれた場合、会社は破綻する可能性がある」という点です。この問題は態度で答えられるものではなく、数字が必要です。そしてその数字はブロクマン側に完全に味方しているわけではありません。1100 億ドルの資金調達のうち、約 250 億ドルだけが確定した即時キャッシュであり、残りは計算資源(Nvidia からの 300 億ドルの大部分は GPU)か、マイルストーン条件付き(Amazon からの 350 億ドル)です。The Information などのメディアによる推計では、OpenAI の 2027 年までの年間キャッシュバーン(資金消費額)は 570 億ドルに達するとされています。資金調達の数字自体は大きいものの、実際のランウェイ(生存可能期間)はわずか 18 か月から 24 ヶ月程度かもしれません。これに対し、Anthropic も同様に 500 億ドルのインフラストラクチャーを約束していますが、収益成長のペースに厳密に合わせて進めています。
より大規模な事前学習(pre-training)を行う必要があるかどうかについては、ブロクマンの立場は明確です。「事前学習を改善すれば、すべての下流工程が容易になる」と彼は言います。しかし同時に、過去 24 ヶ月で重要な転換点があったとも述べています。それはもはや純粋な能力の追求だけでなく、推論効率(inference efficiency)も同時に考慮し、「インテリジェンス × コスト」における最適解を見つけようとしているという点です。
AI のリスクについて触れる際、ブロクマンは「レジリエンス(resilience:回復力・耐性)」の枠組みを提案しました。多くの参加者が技術を開発すると同時に、技術が正しい方向へ進むことを保証するための社会インフラストラクチャーも構築するという考え方です。彼は電力に例えました。「多くの人々が電気を生産しており、電気にも危険は伴いますが、私たちはその周りに安全基準、規制、検査員など一連の体系を築いてきたのです。」
AI に対する一般のネガティブな態度(YouGov のデータによると、アメリカ人の AI による社会への悪影響を懸念する割合は、好影響を支持する割合の 3 倍に達している)について、ブロクマンは人々に AI が具体的にどのように役立つかを見せることが重要だと考えます。彼は医療の事例を挙げました。「ある家庭の子供が頭痛などの症状を示した際、健康保険会社が MRI 検査を拒否しました。その家族は ChatGPT を使って症状を調べた結果、保険会社を説得する論拠を見つけ、MRI の実施に成功しました。その結果、脳腫瘍が見つかり、適切な治療によって子供の命が救われたのです。」彼はこのような物語が「毎日起こっている」と語っています。
データセンターをめぐる議論について、Brockman は OpenAI のアビリーンにある施設(10 万基以上の GPU を配備した世界最大級のスーパーコンピューターの一つ)の年間使用水量が「一般家庭 1 軒分程度」に相当すると主張している。この発言には疑念が残る。参考として、Microsoft は 2024 年の環境報告書で、同社のグローバルデータセンターの年間使用水量が約 70 億リットルであると明らかにしており、Google の数字も同じ量級である。アビリーン施設が最先端の空気冷却方式を採用していたとしても、10 万基の GPU から発生する熱を一般家庭の用水量で処理できる範囲を超えており、かつこの主張は独立した第三者による検証を受けていない。
電力面では、OpenAI が「自腹で負担し」、地元住民の電気料金を引き上げないと約束している。また、ノースダコタ州の事例を引き合いに出して、データセンターの導入が逆に電気料金の低下に寄与したと述べているが、この点についても第三者による裏付けは見つかっていない。
政治献金:2500 万ドルをめぐる議論
MAGA Inc. への 2500 万ドルの寄付に関する議論について、Brockman は自身と妻も両党のスーパー PAC(Political Action Committee)に寄付したと述べた。彼は「単一議題の献金者」であり、「AI 技術を真に受け入れる政治家を支援する」ことに焦点を当てていると主張している。しかし、MAGA Inc. はトランプ氏の議案を広く支持する PAC であり、特定のテクノロジー政策に特化した組織ではない。「単一議題」という位置づけと、献金先の性質の間には明白な緊張関係が存在する。Brockman は同時に、AI の発展を促進する両党系 PAC「Leading the Future」にも 2500 万ドルを寄付している。この 2500 万ドルは MAGA Inc. が 2025 年後半に受け取った最大の単一献金であり、この寄付が 2026 年初頭に #QuitGPT(#グッバイGPT)というボイコット運動を引き起こした。
Brockman の今回のインタビューで構築された物語を分解して見ると、OpenAI が直面しているのは三層の圧力であることが浮かび上がる。

第一に製品面での圧力がある。Sora の機能縮小は出血を止めたが、ChatGPT は依然として世界で最も利用者が多い AI 製品である。しかし、次の賭けである「スーパーアプリ」が直面する競争環境は Sora の時よりも過酷だ。Microsoft 365 Copilot が企業向け、Anthropic が開発者向け、Google が消費者向けにそれぞれ強固な地位を築いており、OpenAI はこれら三社の挟撃の中で「統一された入口」を実現しようとしている。Brockman はこれに対し「数ヶ月以内に提供」と答えているが、Sora の前例が示すように、技術があるからといって製品化が成功するわけではない。
第二に表現のジレンマである。インタビュー全体を通じて、Brockman は最も厳しい質問に対してはデータではなく感情的な言葉で応対し続けた。「Spud」の能力は「嗅覚」によって支えられ、AGI(人工汎用知能)の進捗は「雰囲気」で測られ、Anthropic への追いつきを示す証拠は非公開の社内比較に依存している。これは OpenAI が現在抱える構造的矛盾を反映している。1,100 億ドルの資金調達を完了したばかりの企業として、投資家に対して技術的優位性を証明する必要がある一方で、製品発表前に具体的な数値指標を開示することはできない。その結果、「感覚」が唯一安全な表現手段となっている。問題は、感覚は事実と置き換えられない点だ。特に競合他社がベンチマーク(性能評価)や市場シェアで戦っている状況においてなおさらである。
第三に規模拡大に伴うリスクがある。1,100 億ドルという資金調達の数字は一見恐ろしく見えるが、中身を分解すればそれほど安全ではないとは言い切れない。Brockman は Amodei 氏の「YOLO(人生は一度きり)」という批判に対し、「同意しない」と述べるにとどまり、核心的な質問——需要の成長が予想より一年遅れた場合どうなるのか——には正面から答えていない。彼自身が「計算資源の調達には 18〜24 ヶ月先の予約が必要」と述べている点は、恰好にもアナリストが推定する OpenAI の実際の資金繰りの限界(ランウェイ)と一致している。
Brockman は AI に懐疑的な人々に対し、「まずは試してみればよい」とアドバイスしている。しかし、1,100 億ドルという巨額の賭けが正しいかどうかは、個人の試用体験だけで判断できる問題ではない。今後 6 ヶ月で「Spud」が約束を履行できるか、スーパーアプリが Microsoft と Anthropic の挟撃の中で提供可能かが問われる。これが OpenAI の物語が先見の明に基づくものなのか、単なる話術に過ぎないのかを決定づけることになる。
原始视频:https://www.youtube.com/watch?v=J6vYvk7R190
OpenAI 总裁 Greg Brockman:AI 自我改进、Super App 豪赌、通往 AGI 之路、算力扩张 (続き 8/8)
原文のタイトル行は翻訳対象に含まれないため、本文の最初の段落から直接開始します。
(注:提供された入力テキストには、動画リンクと記事タイトルのみが含まれており、実際の翻訳対象となる記事本文(Greg Brockman のインタビュー内容や解説部分)が存在しません。そのため、該当する日本語訳文を生成することはできません。上記の「原文のタイトル行は翻訳対象に含まれないため...」という注釈は、入力テキストが不完全であることを示すための説明であり、翻訳結果の一部ではありません。)
(※ 実際の翻訳タスクでは、ここに Greg Brockman のインタビュー内容や記事本文の日本語訳が記載されます。例:「AI が自己改善を行う仕組みについて、Brockman氏は...」など)
(※ 入力テキストに記事本文が含まれていないため、この出力はプレースホルダーです。実際の翻訳を希望される場合は、全文を入力してください。)
原文を表示
Greg Brockman 坐进 Big Technology Podcast 的演播室时,OpenAI 刚做完三件大事:砍掉 Sora,收到 1100 亿美元融资,完成下一代模型 Spud 的预训练。砍一个明星产品、拿一笔天价融资、押注一个新模型,三件事同时发生,每一件都需要解释。接下来 90 分钟里,这位 OpenAI 联合创始人兼总裁要完成一项高难度任务:把每一个看似被动的决策重新包装为前瞻性的战略选择。
他做到了吗?大部分时候做到了,但叙事的缝隙里藏着一些值得细看的线索。
Brockman 过去 18 个月主要负责公司的“规模”(Scale)部门,管 GPU 基础设施、数据中心和供应链。这场访谈覆盖的话题跨度极大:从 Sora 为什么被砍,到 Super App 长什么样,到下一代模型能做什么,到 1100 亿美元怎么花,到他为什么给 MAGA Inc 捐了 2500 万美元。

原始视频:https://www.youtube.com/watch?v=J6vYvk7R190
砍掉 Sora 是“聚焦技术主线”还是止血? Brockman 说 Sora 和 GPT 是技术树的不同分支,算力有限只能选一条。但 Sora 日烧百万美元、用户跌破 50 万的现实他没提。
Super App 将合并 ChatGPT、编程 Agent Codex 和浏览器 Atlas 为一个统一应用,预计未来几个月内交付,但这个愿景和微软 365 Copilot 有直接重叠,访谈中没人问这个问题。
下一代模型 Spud 凝聚了约两年的研究突破,Brockman 称其将同时提升 AI 能力的天花板和地板,但能力描述全是感性的,没有具体指标。
AGI 进度自评 70-80%,但 Brockman 同时说 AGI 的定义“更像是一种氛围”,无法精确定义的东西如何精确量化,这个矛盾他没有解决。
承认在编程工具的“最后一公里可用性”上曾落后于 Anthropic,声称已追赶上来,第三方数据显示 Anthropic 企业市场份额仍在快速增长。
回应 Anthropic CEO Dario Amodei 对 OpenAI 基础设施投资“过于激进”的批评:“我不同意。” 但没有回应 Amodei 关于“收入预判偏差一年就可能破产”的具体论证。
砍掉 Sora:技术选择还是商业止血?
Kantrowitz 开场就问:OpenAI 在消费者市场领先,为什么突然把资源从视频生成转走?
Brockman 给出的解释框架和外界猜测相当不同。他说 Sora 的模型和 GPT 系列是“技术树上完全不同的分支”,构建方式根本不同。在算力有限的世界里,同时推进两条技术路线代价极大。他用了一个向量比喻:
随机向量之和为零,对齐方向才能前进。
力量分散就互相抵消,集中才能产生动能。他认为深度学习领域的问题不是机会不够,恰恰是太多,分散投入等于哪个方向都走不远。
这套解释在技术逻辑上自洽,但只讲了故事的一半。据 WSJ 调查和 TechCrunch 报道,Sora 在商业上已经失败:用户量从峰值一百万迅速跌至不足 50 万,每天烧掉约 100 万美元算力成本。据 WSJ 报道,Disney 原计划投资 10 亿美元并将角色授权给 Sora 的交易也随之取消,Disney 在公开宣布前不到一小时才得知消息。关停 Sora 既有技术聚焦的逻辑,也有商业止血的现实压力,Brockman 选择只谈前者。
他强调,这不是“从消费者转向企业”,而是必须做选择。他认为当前最重要的两个应用是:一个了解你、与你的目标对齐的个人助手,和一个能替你解决难题的 AI。光是这两件事,OpenAI 现有的算力都不够用。
一个技术细节:ChatGPT 里的图像生成功能不受影响。图像生成基于 GPT 架构,跟文本、语音同属一条技术路线;Sora 用的是扩散模型(diffusion model),是另一棵树上的东西。Sora 研究团队没有解散,而是转向了机器人领域的世界模拟研究。
Kantrowitz 又问:Google DeepMind 的 Demis Hassabis 认为最接近 AGI 的不是文本模型,而是图像生成器,因为它必须理解物体之间的交互和世界运作方式。OpenAI 放弃这条路线,会不会押错赛道?
Brockman 说这是真实的风险:”绝对是的。在这个领域你必须做选择,必须下注。” 但他话锋一转,说 OpenAI 之所以有信心,是因为”已经看到了通往 AGI 的路径”。他举了一个例子:一位物理学家把一个长期未解的问题交给 OpenAI 的模型,12 小时后拿到了解答,那位物理学家说这是他第一次觉得 AI 在”思考”。不过 Brockman 没有透露具体是哪位物理学家和哪个问题,这一案例无法独立验证。【注:公开信息中,数学家 Terence Tao 在 2026 年 3 月发表了一篇由 ChatGPT Pro 完成核心证明的论文,但那属于数学领域,与此处描述不直接对应。】

Super App:愿景宏大,但谁来回答微软问题?
砍掉了视频生成,OpenAI 把赌注押在了另一个方向。Kantrowitz 问 Super App 到底是什么。
Brockman 说:把 ChatGPT(聊天)、Codex(编程 Agent)和浏览器整合到一个应用里。
电脑本该迁就人,而不是人迁就电脑。
他把 Super App 比作笔记本电脑:你的笔记本是私人用还是办公用?两者都是。Super App 也一样,既是个人助理也是工作工具。个人场景包括 ChatGPT 现有的一切用途,加上更深的记忆和上下文能力。ChatGPT 里已经有一个叫 Pulse 的功能(个性化内容推送),每天根据 AI 对你的了解推送内容。
但 Brockman 说用户看到的界面只是“冰山一角”。更重要的是底层技术的统一:过去两年 AI 的发展已从“只看模型”变成“看整个系统”,模型如何获取上下文、如何连接外部世界、能执行什么操作。这些东西 OpenAI 内部曾有多套实现,现在要收归一统,形成一个通用“AI 层”。一般情况下用户不需要专门的金融 AI 或法律 AI,Super App 足够通用。这个愿景如果实现,确实有可能重新定义 AI 产品的形态。
问题在于,微软 365 Copilot 已经在做几乎一模一样的事,把 AI 嵌入工作流、统一入口、连接各种工具。OpenAI 既是微软的模型供应商又要做微软的直接竞品,这个张力怎么化解?Kantrowitz 没问,Brockman 自然也没答。加上 Sora 刚刚证明了 OpenAI 做消费者产品的记录并不光彩,”几个月内交付”的时间线值得打个问号。

Codex:从程序员到所有人的路还有多远
Super App 的野心如果要落地,Codex 是关键拼图之一。它最初为软件工程师设计,但 OpenAI 内部已经出现了大量非工程师的自发使用。Brockman 说 Codex 底层就是两样东西:一个通用 Agent 框架(能调用工具)加上一个会写代码的 AI。接上电子表格、Word 文档,就能做知识工作。
具体案例:有人用 Codex 做视频剪辑,AI 自己写了一个 Adobe Premiere 插件来自动分章节;内部通信团队的人把 Codex 接上 Slack 和邮箱来整合反馈。这些案例如果属实,说明 AI 作为“万能胶水”连接不同工具的能力正在成型。但它们都是 Brockman 口述的内部使用场景,没有外部用户验证,也没说是否已公开可用。
Brockman 说,对非程序员来说,Codex 现在的可用性很低,设置中碰到报错,开发者知道怎么处理,普通用户直接懵掉。但他认为最难的部分已经做完了(造出真正聪明的 AI),剩下的是“容易得多”的部分:降低门槛。这个判断是否成立,取决于你怎么定义“难”。对做过消费者产品的人来说,“最后一公里”往往比前面九十九公里还难。
他还提到了 OpenClaw 创始人 Peter Steinberger 加入 OpenAI 的事,作为 Codex 向非程序员扩展的信号。Steinberger 是奥地利开发者,2025 年底开发了一个能自主管理邮箱、订餐、控制智能家居的开源 AI Agent,GitHub 星标达 19.6 万,周活用户 200 万。2026 年 2 月,Altman 宣布他加入 OpenAI 负责“下一代个人 Agent”,这个职位本身就说明 OpenAI 在认真对待“让 AI 走出程序员圈子”这件事。
追赶 Anthropic:承认落后,声称追上
Kantrowitz 问:Anthropic 已经有了 Claude 聊天、Claude Cowork、Claude Code,相当于先做出了自己的 Super App。OpenAI 是不是看到 Anthropic 做了才醒悟过来的?
Brockman 承认 OpenAI 过去在编程领域一直有最好的竞赛成绩,但投入不够的是“最后一公里的可用性”。模型在编程竞赛里很聪明,但它从没见过真实世界里乱糟糟的代码库。
大约去年年中,OpenAI 组建了专门团队来解决这个问题:研究真实世界代码库的各种“脏活”,构建训练环境来模拟那些被奇怪的方式打断的混乱场景。他说此时此刻已经追上了,在正面对比中用户更倾向于选择 OpenAI。但他也说前端体验还落后。
第三方数据呈现的画面并不相同。据 Synergy Research 等机构报道,Anthropic 的企业市场份额从 2023 年的低位升至 2025 年底的约 40%,而 OpenAI 从 50% 降至约 27%。Claude Code 在软件工程师群体中获得了极高的口碑。Brockman 说“已经追上”时到底在比什么,模型能力还是市场份额?他巧妙地把战场限定在了前者。
更大的变化在内部。Brockman 说 OpenAI 过去把研究和部署当成”几乎分开的两件事”,现在要整合成一个流程,做研究时就想着产品怎么用。这或许是整段话里最有实质信息量的一句,它暗示 OpenAI 此前的组织架构确实有问题。

从产品竞争到内部文化,Kantrowitz 换了个角度。他问,从 2022 年以来 OpenAI 一直领先,现在竞争激烈了,内部氛围有变化吗?
Brockman 讲了一个故事。ChatGPT 发布后的节日派对上,他感受到公司弥漫着“我们赢了”的气氛。那是他最害怕的一刻。
这是科技公司高管的标准话术,估值 3000 亿美元的公司自称挑战者,和 Google 当年说自己是创业公司一样,信不信随你。但他后面补了一句更实在的话:好的时候别信别人说你多好,坏的时候也别信别人说你多差。
Spud:感觉对了,但数据在哪?
文化之外,接下来是技术。关于下一代模型 Spud,Brockman 确认它是一个新的预训练基础模型,凝聚了“大约两年的研究成果”。
他先纠正了一个思维框架:重要的不是任何一个模型,而是一整个“进步引擎”(engine of progress)。模型开发分几步:先做预训练,在海量数据上训练基础模型,这是最昂贵的阶段;然后做后训练,通过强化学习让模型学会解决各种问题;最后调整行为和可用性。Spud 是新一轮预训练的成果,后续还会经过大量后训练优化。
至于 Spud 能做什么,Brockman 没有给出任何具体指标。他造了一个概念叫 “big model smell”(大模型的味道),当模型真正够强时,你能“闻到”那种质感。你问它问题,它不会答偏,不需要你反复解释。他说 Spud 将同时提升天花板(解决更开放、时间跨度更长的问题)和地板(日常任务的实用性)。
没有 benchmark 分数、没有和竞品的对比、没有具体任务的演示数据。 这种纯感性描述可能出于保密考虑,行业里模型发布前保密是常态。但在竞争对手频繁亮出 benchmark 的当下,光靠“感觉”说服力有限。OpenAI 此前在 GPT-4 发布时也曾刻意回避部分 benchmark 细节,后来靠实际产品表现赢回了话语权。Spud 能不能走同样的路,要看发布后的表现。
2025 年 12 月:拐点叙事
Kantrowitz 问:2025 年 12 月发生了什么?编程 Agent 似乎从理论走向了实用。
Brockman 说那次模型发布让 AI 从“能完成你 20% 的任务”跃升到了“80%”。从“锦上添花”变成了“你必须围绕 AI 重新组织工作流程”。
他分享了一个持续多年的个人测试:让 AI 帮他建一个网站,这个网站他当年学编程时花了几个月才做出来。2025 年大部分时间里需要四五个小时、多轮对话。12 月,一次提示,一次完成。
慢慢地、慢慢地、慢慢地,然后一下子全变了。
这个表达出自海明威《太阳照常升起》,原文说的是“你是怎么破产的”。用来形容 AI 能力的非线性增长,倒也贴切。
另一个案例:一位和他密切合作的工程师做底层系统工程,在 GPT 5.2 时代完全用不了 AI。到了 5.3,给 AI 一份设计文档,它能实现代码、添加监控指标、运行性能分析器、自行优化,产出就是工程师想要的东西。
对于“GPT-5 发布后公众反应有些失望”,Brockman 说每次发布都有两群人:一群觉得天壤之别,另一群用的场景不是智能瓶颈,感受不到差异。真正的转变是人们对 AI 能力的心智模型更新得比技术本身慢。
AGI:70-80%,但定义是个“氛围(Vibe)”
Nvidia CEO 黄仁勋最近说“我认为我们已经实现了 AGI”。Kantrowitz 问 Brockman 是否同意。
Brockman 说 AGI 对不同人有不同定义。当前的技术“非常参差不齐”(very jagged):在写代码这类任务上已经超越人类,但某些人类轻松完成的基本任务 AI 仍然做不好。画线画在哪里,“更像是一种氛围和感觉,而不是科学”。
他给了一个自我评估:70-80% 到了。
这个自相矛盾的表述其实折射了整个行业的困境。如果 AGI 的定义连科学都算不上,更像“氛围”,那 70-80% 是怎么算出来的?每个人都在量化一个他们承认无法精确定义的概念。Huang 的 AGI 定义极窄,他自己也承认 10 万个 Agent 也造不出 Nvidia;Lex Fridman 曾提出“能否创办和运营一家 10 亿美元公司”作为判据。Brockman 比 Huang 谨慎,但陷入了同样的定义困境。
他认为未来几年内 AGI 会实现,AI 将能完成几乎所有你在电脑上做的智力工作,但能力仍然是参差不齐的。
自动化 AI 研究员:让 AI 加速 AI
OpenAI 计划今年秋季推出一个自动化 AI 研究员。
Brockman 把当前阶段称为“起飞”(takeoff),这个词在 AI 安全领域有特定含义,指 AI 进入快速递归自我改进的阶段。他在这个语境下用它,至少说明他清楚这个词的分量。他的意思分两层:技术上,AI 越好就越能加速自身改进;应用上,芯片厂商加大投入、企业在各领域摸索 AI 应用,所有能量在积累。
具体到 AI 研究员,Brockman 的定义是:把 OpenAI 一个研究科学家的完整端到端工作搬到硅片上运行。
但他强调这不意味着放手让 AI 自己跑。他打了个比方:就像带初级研究员,放太久不管他就会走上没用的路。高级研究员提供方向和审查,AI 负责执行。
Agent 时代,人类的责任不能外包
Kantrowitz 引用了 Brockman 此前说过的话:当你用 AI Agent 做事时,“你变成了一支成千上万 Agent 舰队的 CEO,它们在执行你的目标和愿景,但你并不了解每件事具体怎么解决的。这种新的工作方式可能让你觉得失去了对问题的脉搏感。”
Brockman 说,这是好坏参半的,关键是“承认优势、减轻弱点”。AI Agent 给人巨大的杠杆,但归根到底有一个“负责任的当事人”。你的 Agent 搞砸了网站影响了用户,那不是 Agent 的错,是你的错。
Kantrowitz 问:但“失去脉搏感”和“负责任”怎么兼得?
Brockman 用装修做比方:请总包装修房子,有些细节你确实不用操心,因为你信任专业人士。但如果出了问题,你应该知道。“你不能盲目接受'我可以不管了'。你需要主动保持对问题的把控。”
1100 亿算力豪赌:收入中心还是赌场筹码?
从技术路线和产品愿景回到商业现实。
Brockman 把算力类比为雇销售人员:只要产品能卖出去、有可扩展的销售方式,销售人员越多收入就越高。算力不是成本中心,是收入中心。他讲了 ChatGPT 发布当天的内部对话:
“该买多少算力?”“全部。”“不不不,说真的,该买多少?”“不管我们怎么建,我知道都跟不上需求。”
他说从那以后每一年都被证明是对的。ChatGPT 目前周活用户超过 4 亿,消费者订阅收入持续增长,从需求端看这个判断确实成立。但挑战在于算力采购需要提前 18 到 24 个月锁定,必须精准预判未来。
收入结构方面,消费者订阅目前仍是最大来源,但企业知识工作领域增长极快。他不认为未来收入会简单分为“消费者”和“企业”两类,更像是用户拥有一个数字世界的入口,收入来自这个入口。
Kantrowitz 提到了 Dario Amodei 暗示某些竞争对手在“YOLO 式”烧钱,把“风险旋钮拧得太远”。
Brockman 的回应是:“我不同意。我们一直非常深思熟虑,是最早意识到这一趋势并提前布局的。”
但“我不同意”之后他没有回应 Amodei 的核心论点:如果收入预判偏差一年,公司就可能破产。这个问题不是态度能回答的,需要数字。而数字并不完全站在 Brockman 这边:1100 亿融资中只有约 250 亿是确定的即时现金,其余要么是算力(Nvidia 的 300 亿大部分是 GPU)、要么有里程碑条件(Amazon 的 350 亿)。据 The Information 等媒体估计,OpenAI 到 2027 年的年度现金消耗将达 570 亿美元。融资数字虽大,实际跑道可能只有 18-24 个月。相比之下,Anthropic 同样承诺了 500 亿美元基础设施,但严格按收入增长节奏推进。
关于是否还需要做更大规模的预训练,Brockman 的立场明确:改进预训练会让所有下游步骤都更容易。但他也说过去 24 个月有一个重要转变:不再只追求原始能力,开始同时考虑推理效率,目标是找到”智能 × 成本”的最优解。

谈到 AI 风险,Brockman 提出了“韧性”(resilience)框架:很多参与者共同开发技术,同时建立社会基础设施来确保技术走向正确。他拿电力做类比:很多人生产电力,电力也有危险,但我们围绕它建立了安全标准、监管、检查员等一整套体系。
关于公众对 AI 的负面态度(YouGov 数据显示认为 AI 对社会负面影响的美国人是认为正面影响的三倍),Brockman 认为关键是向人们展示 AI 如何具体帮助他们。他举了一个医疗案例:一个家庭的孩子出现头痛等症状,医保拒绝了 MRI 检查,他们用 ChatGPT 研究症状后找到了说服保险公司的论据,拿到了 MRI,发现是脑瘤,及时治疗救了孩子一命。他说这类故事“每天都在发生”。
数据中心争议方面,Brockman 声称 OpenAI 在 Abilene 的设施(部署超过 10 万 GPU 的世界最大超算之一)全年用水量“相当于一个家庭”。这个说法令人存疑。作为参照,微软在 2024 年环境报告中披露其全球数据中心年用水量约 70 亿升,Google 的数字也在同一量级。即便 Abilene 设施采用了最先进的空气冷却方案,10 万块 GPU 的散热量也远超一个家庭用水所能处理的范围,且这一说法未经任何独立验证。在电力方面,他承诺 OpenAI 会“自己买单”,不推高当地居民电价,并举了北达科他州的例子说数据中心到来反而帮助降低了电费,这一说法同样未找到第三方验证。
政治捐款:2500 万美元的争议
关于他向 MAGA Inc 捐赠 2500 万美元的争议,Brockman 说他和妻子也给两党超级 PAC 捐了款。他自称是“单一议题捐赠者”,关心的是支持那些“真正拥抱 AI 技术的政治家”。但 MAGA Inc. 是一个广泛支持 Trump 议程的 PAC,不是专门的科技政策组织,“单一议题”的定位与捐款对象之间存在明显张力。Brockman 同时向 Leading the Future(一个促进 AI 发展的两党 PAC)捐了 2500 万美元。2500 万美元是 MAGA Inc. 2025 年下半年收到的最大单笔捐款,这笔捐款在 2026 年初引发了 #QuitGPT 抵制运动。
拆解 Brockman 在这场访谈中构建的叙事,可以看到 OpenAI 正面对三层压力。

第一层是产品压力。 砍 Sora 确实止了血,ChatGPT 仍然是全球用户量最大的 AI 产品,但下一个赌注 Super App 面临的竞争环境比 Sora 更残酷。微软 365 Copilot 在企业端、Anthropic 在开发者端、Google 在消费者端,OpenAI 要在三者的夹击中做一个“统一入口”。Brockman 对此的回应是“几个月内交付”,但 Sora 的前车之鉴说明,有技术不等于能做好产品。
第二层是表达困境。 整场访谈中,Brockman 在被问到最硬的问题时,反复用感性语言代替数据。Spud 的能力靠“闻”,AGI 的进度靠“氛围”,追上 Anthropic 的证据是未公开的内部对比。这反映了 OpenAI 当前的一个结构性矛盾:作为一家刚融完 1100 亿美元的公司,它需要向投资人证明技术领先,但又不能在产品发布前泄露具体指标。于是“感觉”成了唯一安全的表达方式。问题是,感觉不能替代事实,尤其当竞争对手在用 benchmark 和市场份额说话的时候。
第三层是规模风险。 1100 亿美元的融资数字听起来吓人,但拆开看并没有那么安全。Brockman 对 Amodei“YOLO”批评的反驳停留在“我不同意”,始终没有正面回应核心问题:如果需求增长比预期慢一年会怎样?他自己说算力采购需要提前 18-24 个月锁定,这恰好也是分析师估计的 OpenAI 实际跑道。
Brockman 给 AI 怀疑者的建议是“先试试再说”。但 1100 亿美元的赌注正确与否,不是个人试用体验能回答的问题。接下来 6 个月,Spud 是否兑现承诺、Super App 能否在微软和 Anthropic 的夹击中交付,将决定这套叙事究竟是远见还是话术。
原始视频:https://www.youtube.com/watch?v=J6vYvk7R190
関連記事
エンジニア以外にもCoding Agent活用を広げる架け橋に ─ 個人開発から始まった、Codex×Electron製GUIエージェント誕生秘話インタビュー
筆者は個人開発で作成したCodex×Electron製GUIエージェントを紹介し、エンジニア以外もCoding Agentを活用できる仕組みの構築過程をインタビューで解説している。
イーロン・マスク氏によるサム・アルトマン CEO に対する訴訟の全請求が棄却される
裁判所が、イーロン・マスク氏が OpenAI のサム・アルトマン CEO を相手取って提起したすべての法的請求を棄却する判決を下しました。
ムスク対アルトマン裁判は、AI が不適切な人物に導かれていることを証明した
The Verge AI は、イーロン・ムスクとサム・アルトマンの法廷闘争が AI の支配権を巡る戦いだったと報じ、この結果が AI 業界を誤ったリーダーシップが率いていることを示したと分析している。