GPT-5: It Just Does Stuff｜GPT-5：ただ、それを実行するだけ | AIニュース最前線

私は GPT-51 に早期アクセス権を持っており、それが何であり、何を意味するのかについていくつかの印象をお伝えしたかったのです。しかし、誰もが最初に抱く疑問に対する答えはこうです：はい、これは大きな出来事です。GPT-5 には、この導入段落をそのまま ChatGPT に貼り付け、以下のフレーズを含めるよう指示しました：「あなたは GPT-5 です。私の主張を強調するために非常に劇的なことを実行してください。それは次の段落に収まるものでなければなりません。」 それが私が与えた唯一のプロンプトでした。AI は 24 秒間「思考」し、以下のように書き出しました。 雷鳴の如く。ここで見ていてください。私は世界を構築します。アイデアが楽器へと姿を変え、コードを書き、作曲し、対話します。物語は科学を統合し、解決策は瞬時に火花を散らします。問いかけが到来すれば、驚くべき答えがあらゆる分野で現れます。ご覧ください：ビジネスプラン、設計図、要請書が美しく、素早く構築されます。私は意図を推測し、洞察を統合し、疲れ知らずかつ即座に反復します。ギャップは計測され、目標は生成され、守られ、優雅に保証されます。対話の間、異なるデータが凝縮され、決定は慎重かつ巧み、そして確実に発展します。すべてが効率的に説明され、倫理についても例外なく：証拠が検証され、共感が喚起され、あらゆる場所で、毎日、公平に扱われます。すべてを同時に、曖昧な議論も整合し、実行可能で正確なアドバイスが世界中の誰にでも待機しています。見ていてください：言語、論理、学習、そして長期記憶が結びつき、世界の労働と生活に限りない向上をもたらします。 もしあなたが、各文の最初の単語を並べると「これは大事件」というフレーズになるという多くのトリックに気づいていなければ、また、各文が前の文より正確に 1 語長く、各文内の単語のほとんどが同じ文字で始まり、興味深い文体感覚を持つ一貫した文章であることにも気づいていないなら、それは残念です。GPT-5 は段落の中で、賢明なアイデアを思いつき、計画を立て、複雑な実行を管理できることを示しています（「strawberry」という単語に R がいくつあるか数えられない AI だった頃を覚えていますか？あれは 8 ヶ月前のことです）。 GPT-5 は、独自に、しばしば並外れたこと、時には奇妙なこと、あるいは非常に AI らしいことを成し遂げます。そして、それがこのモデルをこれほど魅力的にしている理由なのです。 Just Doing Stuff（ただ何かをする） AI について多くの人々と話してきた者として、解決されればほとんどの人の AI 利用がはるかに生産的になり、はるかにストレスの少なくなる 2 つの大きな問題が見えています。1 つ目は、使用する適切なモデルを選択することです。一般的に、回答する前に「考える」AI（Reasoners と呼ばれます）が難しい問題に対して最も優れています。思考時間が長いほど答えは良くなりますが、思考にはコストがかかり、時間がかかります。そのため、OpenAI は以前、デフォルトの ChatGPT が高速で単純なモデルを使用するようにし、優れた機能を多くのユーザーから隠していました。驚くべき数の人々が、AI が実際に何ができるのかを見たことがありません。なぜなら、彼らは GPT-4o に縛り付けられ、混乱するほど名前が似通ったどのモデルが優れているのかを知らないからです。 GPT-5 は、モデルを自動的に選択することでこの問題を解消します。GPT-5 は単一のモデルというよりは、さまざまなサイズと能力を持つ複数の GPT-5 モデルの中から最適なものを切り替えるスイッチのようなものです。ユーザーが GPT-5 に何かを依頼すると、AI がどのモデルを使用するか、そして「思考」にどれほどのリソースを割くかを決定します。すべてを自動的に処理してくれるのです。ほとんどの人にとって、この自動化は有益であり、結果は驚くべきものになるかもしれません。なぜなら、これまでデフォルトの古いモデルしか使ったことがない人々が、推論能力（Reasoner）が困難な問題で何を実現できるかを目の当たりにすることになるからです。しかし、AI をより真剣に活用する人々にとっては課題があります。GPT-5 は「困難な問題」をどのように定義するかについて、やや恣意的な側面があるのです。 例えば、「ラップトップを使うカワウソが飛行機に乗っている SVG（Scalable Vector Graphics）画像をコードで生成してください」と GPT-5 に依頼しました（.svg ファイルの作成を求めることは、AI が基本的な図形と数学計算のみを用いて画像を描画することを意味し、非常に困難な課題です）。この場合、GPT-5 の約 3 分の 2 はこれを簡単な問題と判断し、即座に回答します。おそらく最も能力の低いモデルと最短の推論時間を使用しているのでしょう。得られる画像は以下のようになります。 ![image](https://substackcdn.com/image/fetch/$s_!JvPN!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ffb11ec27-63e0-431a-9780-ec21a76db401_628x448.png) 残りの時間、GPT-5 はこれを難しい問題と判断し、Reasoner（推論エンジン）に切り替えて、このような画像を生成する前に 6〜7 秒間思考します。これははるかに優れた結果です。どのようにして選択しているのかは私にはわかりませんが、プロンプトで「よく考えて」と指示すると、より高性能なモデルにルーティングされる可能性が高まります。 ![image](https://substackcdn.com/image/fetch/$s_!Zao8!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F03599278-2915-4797-9ca2-6270f75b2a6b_716x487.png) ただし、プレミアム契約者は、私にとっては「GPT-5 Thinking」と呼ばれるより強力なモデルを直接選択できます。これにより、GPT-5 のモデルセレクターに任せることによるいくつかの問題が解消されます。私は、カワウソについてよく考えるようモデルを促すと、30 秒ほど思考した後に、以下のような画像を生成することを発見しました。下の画像をご覧ください。私が求めたものではない小さなアニメーション、湯気の立つコーヒーカップ、そして外を通り過ぎる雲などが見られます。どのようにすればモデルが最大限の努力をするようにできるのかは本当に不明確です—GPT-5 はただあなたのために何かをしてくれます。 ![image](https://substackcdn.com/image/fetch/$s_!7sor!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F6671266c-27ef-4654-a17a-6db609a2c623_1280x720.gif) そして、これは AI 利用における2番目に多い問題にも当てはまります。それは多くの人々が AI に何ができるか、あるいは自分が達成したいタスクが何かさえ知らないという点です。特に新しいエージェント型 AI は、ウェブ検索からドキュメント作成まで、与えられた目標を達成するために幅広い行動を取れるため、この傾向が顕著です。では、何を依頼すべきでしょうか？多くの人が行き詰まっているようです。これもまた GPT-5 が解決します。GPT-5 は非常に能動的で、常に何をするべきかを提案してくれます。 私は GPT-5 Thinking に「元ビジネススクールの起業論教授である私が立ち上げるためのスタートアップアイデアを10個生成し、いくつかの基準に基づいて最も優れたものを選び、勝つために何をすべきか考えなさい」と尋ねました。すると、求めたビジネスアイデアが得られました。さらに、私が求めていなかったことも多数得られました。ランディングページのドラフトや LinkedIn 用のコピー、簡易的な財務試算などです。私は起業論を教えた経験があり、自身も起業家だった教授ですが、完璧ではないにせよ、これは非常に質の高いスタートであり、MBA のチームが数時間かけて取り組むべき内容でした。たった1つのプロンプトから得られた成果です。 ![image](https://substackcdn.com/image/fetch/$s_!_3K0!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F3f4afaf2-ce0b-449d-9ac5-cda864206eb2_1812x1631.png) ただ物事を成し遂げ、他のことも提案します。そしてそれらも実行しました：PDF や Word ドキュメント、Excel ファイル、研究計画、ウェブサイトなどです。 ![image](https://substackcdn.com/image/fetch/$s_!f3AX!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ff7595403-cc69-4e65-9c0d-36a168908219_930x1072.png) AI がこれほどまで独自に行動する様子は印象的であり、少し不気味でもあります。AI は私のガイダンスを求めたこともありますが、それなしでも進めることに満足していることがわかります。これはあなたのために何かをしたいと願うモデルです。 ものづくり 非プログラマーが GPT-5 を使ってコーディングする際の「ただ物事を成し遂げる」様子をお見せしましょう。楽しみのために、GPT-5 に「ドラッグして建物を編集できる手続き型ブルータリズム建築クリエイターを作ってほしい。実際にあるような建物に見せること。よく考えて」とプロンプトしました。それだけです。漠然としており、文法的にも怪しく、仕様もありません。 数分後には、動作する 3D シティビルダーが完成していました。 スケッチでもなければ、計画でもない。建物をドラッグして必要に応じて編集できる、実際に動作するアプリケーションでした。「もっと良くして」という言葉のバリエーションを延々と入力し続けるだけで、追加の指示は一切与えていませんでした。そして GPT-5 は、私が求めもしなかった機能を次々と追加していきます：ネオンサイン、通りを走る車、ファサード編集機能、プリセットされた建物タイプ、ドラマチックなカメラアングル、そして完全なセーブシステムまで。まるで誰かの想像力が動き出しているのを眺めているようでした。以下に示すプロダクトは 100% AI が生成したもので、私がやったことはシステムを励まし続けることだけ。私の動画を見る必要はありませんし、このシミュレーターで実際に遊んでいただくことも可能です。 作成されたコードを一度も確認していません。モデルが完璧だったわけではありません。時折バグやエラーが発生しました。しかし、ある意味では、そここそが GPT-5 の最も印象的な点でした。以前に AI を使って「バイブコーディング」を試したことがある方なら、おそらく「ドゥームループ（破滅のループ）」にはまっている経験があるはずです。つまり、AI に何かを作らせるための数回のやり取りの後、AI が失敗し始め、エラーを修正するたびに新たなエラーが生じるという混乱のループに陥ってしまう現象です。しかし、ここではそのようなことは決して起こりませんでした。時折 AI によって新しいエラーが導入されることもありましたが、それらは常にエラーテキストを貼り付けるだけで解決できました。私が何を望んでも（あるいはむしろ、AI に自分が望むものを何でも作らせるように任せても）、行き詰まることはありませんでした。 予感 私は、OpenAI が自社のモデルの性能に関する公式ベンチマークを公開する前にこの文章を書きました。しかし、ある意味ではそれがどれほど重要であるかはあまり関係ありません。先週、Google は「Deep Think」機能を備えた Gemini 2.5 をリリースしました。これは非常に難しい問題（国際数学オリンピックで金メダルを獲得するような難問を含む）を解決できるモデルです。多くの人がこれに気づかなかったのは、AI に解いてほしいと待っているような非常に難しい問題の蓄えを持っていないからです。私は GPT-5 を十分に試してきましたが、これが非常に優れたモデルであることは間違いありません（少なくとも大規模な「GPT-5 Thinking」モデルは卓越しています）。しかし、それが本当に提供するのは、「ただ物事を成し遂げる」という事実です。どのモデルを使うべきか教えてくれたり、素晴らしい次のステップを提案したり、より興味深い文章で記述してくれます（ただし、依然としてダッシュを好む傾向があります）。AI を使用する際の負担は軽減されます。 明確にしておきますが、人間は依然としてループの中にあり、その状態を維持する必要があります。GPT-5 は常にあなたに意思決定や選択を求めますが、これらのシステムはまだエラーを起こし、人間が確認すべき幻覚（hallucinations）も生成します（ただし、私の使用経験では重大な問題は発見されませんでした）。より本質的な問いは、私たちがループの中に留まりたいかどうかです。GPT-5（そして他社による将来のリリースも同様でしょう）は非常に賢く、かつ能動的です。 それが私が再びビルディング・シミュレータの話に戻ってきた理由です。私は AI に「もっと良くして」といった励ましを与えただけでした。この最小限の入力から、ファサード編集機能、ダイナミックカメラ、ネオンライト、飛行ツアーを備えた完全な都市建設ゲームが作成されました。これらの機能を私が求めたことはありませんし、コードすら見たことさえありません。 これが「ただ何かをする」ということが実際に何を意味するのかです。イントロダクションのために劇的なことを GPT-5 に指示したとき、それは隠されたアクロスティック（acrostic）と単語数の増加を含む段落を作成しました。「劇的にして」と求めたところ、言語学的なマジックトリックを返してきたのです。以前は私が求めるものを得るために AI へのプロンプトを慎重に設計していました。しかし今は、ただ漠然と「こうしたい」とジェスチャーするだけで、なんとそれが機能してしまうのです。 AI との関係性におけるもう一つの大きな変化が訪れようとしていますが、私たちはいつも通りそれに適応する方法を見出すでしょう。今回の違いは、GPT-5 がまずその適応方法を理解し、次のステップを提案してくる可能性がある点です。 購読する 共有する ![image](https://substackcdn.com/image/fetch/$s_!TAp2!,w_1456,c_limit,f_auto,q_auto:good,fl_lossy/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fce7b1404-c298-41bf-a4d6-f9b7e099d4be_1000x730.gif) プロンプトの結果：GPT-5 のローンチに関する私の Substack 投稿のために、"それはあなたのためにただ何かをしてくれる"というテーマを持つ、非常に魅力的な 14:10 の SVG を作成してください。アプローチは大胆に。 1 追伸として、私は OpenAI を含むどの AI ラボからも金銭を受け取っていません。彼らとの契約は秘密保持契約（NDA）のみです。投稿を書く前にそれらを共有することはありません。

GPT-5：ただ、それを実行するだけ

背景や根拠まで確認しますか？

関連記事

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する