GPT-5:ただ、それを実行するだけ
One Useful Thing の著者が GPT-5 の早期アクセス権限を通じて、複雑な制約条件を自律的に満たす能力や、ユーザーに代わって最適なモデルを選択する「自動スイッチ」機能の登場を報告し、AI が自ら行動を起こす新たなフェーズに入ったと分析している。
キーポイント
高度な自律的実行能力
GPT-5 は単なる指示に従うだけでなく、複雑な制約(各文の単語数増加、頭文字の隠語、一貫したスタイル)を自ら計画し、24 秒間の思考を経て正確に実行する能力を示した。
モデル選択の自動化
従来の「推論型」と「高速型」の使い分けや混乱を解消するため、GPT-5 は内部で複数のサブモデルを自動的に切り替えるスイッチとして機能し、タスクに応じて最適なモデルを選定する。
AI の行動様式の変化
ユーザーが明示的に指示しなくても、AI 自身が「何かすごいこと」や「奇妙なこと」、あるいは「AI らしいこと」を自発的に行うようになり、人間との対話における能動性が劇的に向上した。
自動モデル選択の仕組みと不透明性
GPT-5 はユーザーに代わって自動的に最適なモデルサイズと思考時間を決定しますが、どの問題を「難しい」と判断するかは somewhat arbitrary(ある程度恣意的)であり、その基準が不明確です。
プロンプト操作による性能向上
ユーザーが明示的に「think hard」と指示することで、より強力な Reasoner モデルにルーティングされる可能性が高まり、生成結果の質が劇的に向上します。
AI の能動的な提案機能
GPT-5 はユーザーの指示を待つだけでなく、必要なタスクや追加アクションを積極的に提案し実行する「エージェント」として動作します。
複雑なビジネス課題への即応力
単一のプロンプトで起業アイデアの生成から選定、そしてランディングページや財務計画などの実務資料作成まで、MBA チームが数時間かかる作業を完了させます。
影響分析・編集コメントを表示
影響分析
この記事は、GPT-5 が単なる言語モデルのバージョンアップではなく、ユーザーの意図を汲み取り、複雑なタスクを自律的に分解・実行する「エージェント」としての側面を強めたことを示唆しています。特にモデル選択の自動化は、AI の実用化における最大の障壁であった「どのモデルを使うか」の迷いを解消し、開発現場や一般ユーザーの利用体験を劇的に向上させる可能性があります。
編集コメント
GPT-5 の「思考」プロセスと自律的な実行能力は、従来のチャットボットとは異なる、より能動的な AI アシスタントの到来を告げる重要な転換点です。
私は GPT-51 に早期アクセス権を持っており、それが何であり、何を意味するのかについていくつかの印象をお伝えしたかったのです。しかし、誰もが最初に抱く疑問に対する答えはこうです:はい、これは大きな出来事です。GPT-5 には、この導入段落をそのまま ChatGPT に貼り付け、以下のフレーズを含めるよう指示しました:「あなたは GPT-5 です。私の主張を強調するために非常に劇的なことを実行してください。それは次の段落に収まるものでなければなりません。」
それが私が与えた唯一のプロンプトでした。AI は 24 秒間「思考」し、以下のように書き出しました。
雷鳴の如く。ここで見ていてください。私は世界を構築します。アイデアが楽器へと姿を変え、コードを書き、作曲し、対話します。物語は科学を統合し、解決策は瞬時に火花を散らします。問いかけが到来すれば、驚くべき答えがあらゆる分野で現れます。ご覧ください:ビジネスプラン、設計図、要請書が美しく、素早く構築されます。私は意図を推測し、洞察を統合し、疲れ知らずかつ即座に反復します。ギャップは計測され、目標は生成され、守られ、優雅に保証されます。対話の間、異なるデータが凝縮され、決定は慎重かつ巧み、そして確実に発展します。すべてが効率的に説明され、倫理についても例外なく:証拠が検証され、共感が喚起され、あらゆる場所で、毎日、公平に扱われます。すべてを同時に、曖昧な議論も整合し、実行可能で正確なアドバイスが世界中の誰にでも待機しています。見ていてください:言語、論理、学習、そして長期記憶が結びつき、世界の労働と生活に限りない向上をもたらします。
もしあなたが、各文の最初の単語を並べると「これは大事件」というフレーズになるという多くのトリックに気づいていなければ、また、各文が前の文より正確に 1 語長く、各文内の単語のほとんどが同じ文字で始まり、興味深い文体感覚を持つ一貫した文章であることにも気づいていないなら、それは残念です。GPT-5 は段落の中で、賢明なアイデアを思いつき、計画を立て、複雑な実行を管理できることを示しています(「strawberry」という単語に R がいくつあるか数えられない AI だった頃を覚えていますか?あれは 8 ヶ月前のことです)。
GPT-5 は、独自に、しばしば並外れたこと、時には奇妙なこと、あるいは非常に AI らしいことを成し遂げます。そして、それがこのモデルをこれほど魅力的にしている理由なのです。
Just Doing Stuff(ただ何かをする)
AI について多くの人々と話してきた者として、解決されればほとんどの人の AI 利用がはるかに生産的になり、はるかにストレスの少なくなる 2 つの大きな問題が見えています。1 つ目は、使用する適切なモデルを選択することです。一般的に、回答する前に「考える」AI(Reasoners と呼ばれます)が難しい問題に対して最も優れています。思考時間が長いほど答えは良くなりますが、思考にはコストがかかり、時間がかかります。そのため、OpenAI は以前、デフォルトの ChatGPT が高速で単純なモデルを使用するようにし、優れた機能を多くのユーザーから隠していました。驚くべき数の人々が、AI が実際に何ができるのかを見たことがありません。なぜなら、彼らは GPT-4o に縛り付けられ、混乱するほど名前が似通ったどのモデルが優れているのかを知らないからです。
GPT-5 は、モデルを自動的に選択することでこの問題を解消します。GPT-5 は単一のモデルというよりは、さまざまなサイズと能力を持つ複数の GPT-5 モデルの中から最適なものを切り替えるスイッチのようなものです。ユーザーが GPT-5 に何かを依頼すると、AI がどのモデルを使用するか、そして「思考」にどれほどのリソースを割くかを決定します。すべてを自動的に処理してくれるのです。ほとんどの人にとって、この自動化は有益であり、結果は驚くべきものになるかもしれません。なぜなら、これまでデフォルトの古いモデルしか使ったことがない人々が、推論能力(Reasoner)が困難な問題で何を実現できるかを目の当たりにすることになるからです。しかし、AI をより真剣に活用する人々にとっては課題があります。GPT-5 は「困難な問題」をどのように定義するかについて、やや恣意的な側面があるのです。
例えば、「ラップトップを使うカワウソが飛行機に乗っている SVG(Scalable Vector Graphics)画像をコードで生成してください」と GPT-5 に依頼しました(.svg ファイルの作成を求めることは、AI が基本的な図形と数学計算のみを用いて画像を描画することを意味し、非常に困難な課題です)。この場合、GPT-5 の約 3 分の 2 はこれを簡単な問題と判断し、即座に回答します。おそらく最も能力の低いモデルと最短の推論時間を使用しているのでしょう。得られる画像は以下のようになります。

残りの時間、GPT-5 はこれを難しい問題と判断し、Reasoner(推論エンジン)に切り替えて、このような画像を生成する前に 6〜7 秒間思考します。これははるかに優れた結果です。どのようにして選択しているのかは私にはわかりませんが、プロンプトで「よく考えて」と指示すると、より高性能なモデルにルーティングされる可能性が高まります。

ただし、プレミアム契約者は、私にとっては「GPT-5 Thinking」と呼ばれるより強力なモデルを直接選択できます。これにより、GPT-5 のモデルセレクターに任せることによるいくつかの問題が解消されます。私は、カワウソについてよく考えるようモデルを促すと、30 秒ほど思考した後に、以下のような画像を生成することを発見しました。下の画像をご覧ください。私が求めたものではない小さなアニメーション、湯気の立つコーヒーカップ、そして外を通り過ぎる雲などが見られます。どのようにすればモデルが最大限の努力をするようにできるのかは本当に不明確です—GPT-5 はただあなたのために何かをしてくれます。

そして、これは AI 利用における2番目に多い問題にも当てはまります。それは多くの人々が AI に何ができるか、あるいは自分が達成したいタスクが何かさえ知らないという点です。特に新しいエージェント型 AI は、ウェブ検索からドキュメント作成まで、与えられた目標を達成するために幅広い行動を取れるため、この傾向が顕著です。では、何を依頼すべきでしょうか?多くの人が行き詰まっているようです。これもまた GPT-5 が解決します。GPT-5 は非常に能動的で、常に何をするべきかを提案してくれます。
私は GPT-5 Thinking に「元ビジネススクールの起業論教授である私が立ち上げるためのスタートアップアイデアを10個生成し、いくつかの基準に基づいて最も優れたものを選び、勝つために何をすべきか考えなさい」と尋ねました。すると、求めたビジネスアイデアが得られました。さらに、私が求めていなかったことも多数得られました。ランディングページのドラフトや LinkedIn 用のコピー、簡易的な財務試算などです。私は起業論を教えた経験があり、自身も起業家だった教授ですが、完璧ではないにせよ、これは非常に質の高いスタートであり、MBA のチームが数時間かけて取り組むべき内容でした。たった1つのプロンプトから得られた成果です。

ただ物事を成し遂げ、他のことも提案します。そしてそれらも実行しました:PDF や Word ドキュメント、Excel ファイル、研究計画、ウェブサイトなどです。

AI がこれほどまで独自に行動する様子は印象的であり、少し不気味でもあります。AI は私のガイダンスを求めたこともありますが、それなしでも進めることに満足していることがわかります。これはあなたのために何かをしたいと願うモデルです。
ものづくり
非プログラマーが GPT-5 を使ってコーディングする際の「ただ物事を成し遂げる」様子をお見せしましょう。楽しみのために、GPT-5 に「ドラッグして建物を編集できる手続き型ブルータリズム建築クリエイターを作ってほしい。実際にあるような建物に見せること。よく考えて」とプロンプトしました。それだけです。漠然としており、文法的にも怪しく、仕様もありません。
数分後には、動作する 3D シティビルダーが完成していました。
スケッチでもなければ、計画でもない。建物をドラッグして必要に応じて編集できる、実際に動作するアプリケーションでした。「もっと良くして」という言葉のバリエーションを延々と入力し続けるだけで、追加の指示は一切与えていませんでした。そして GPT-5 は、私が求めもしなかった機能を次々と追加していきます:ネオンサイン、通りを走る車、ファサード編集機能、プリセットされた建物タイプ、ドラマチックなカメラアングル、そして完全なセーブシステムまで。まるで誰かの想像力が動き出しているのを眺めているようでした。以下に示すプロダクトは 100% AI が生成したもので、私がやったことはシステムを励まし続けることだけ。私の動画を見る必要はありませんし、このシミュレーターで実際に遊んでいただくことも可能です。
作成されたコードを一度も確認していません。モデルが完璧だったわけではありません。時折バグやエラーが発生しました。しかし、ある意味では、そここそが GPT-5 の最も印象的な点でした。以前に AI を使って「バイブコーディング」を試したことがある方なら、おそらく「ドゥームループ(破滅のループ)」にはまっている経験があるはずです。つまり、AI に何かを作らせるための数回のやり取りの後、AI が失敗し始め、エラーを修正するたびに新たなエラーが生じるという混乱のループに陥ってしまう現象です。しかし、ここではそのようなことは決して起こりませんでした。時折 AI によって新しいエラーが導入されることもありましたが、それらは常にエラーテキストを貼り付けるだけで解決できました。私が何を望んでも(あるいはむしろ、AI に自分が望むものを何でも作らせるように任せても)、行き詰まることはありませんでした。
予感
私は、OpenAI が自社のモデルの性能に関する公式ベンチマークを公開する前にこの文章を書きました。しかし、ある意味ではそれがどれほど重要であるかはあまり関係ありません。先週、Google は「Deep Think」機能を備えた Gemini 2.5 をリリースしました。これは非常に難しい問題(国際数学オリンピックで金メダルを獲得するような難問を含む)を解決できるモデルです。多くの人がこれに気づかなかったのは、AI に解いてほしいと待っているような非常に難しい問題の蓄えを持っていないからです。私は GPT-5 を十分に試してきましたが、これが非常に優れたモデルであることは間違いありません(少なくとも大規模な「GPT-5 Thinking」モデルは卓越しています)。しかし、それが本当に提供するのは、「ただ物事を成し遂げる」という事実です。どのモデルを使うべきか教えてくれたり、素晴らしい次のステップを提案したり、より興味深い文章で記述してくれます(ただし、依然としてダッシュを好む傾向があります)。AI を使用する際の負担は軽減されます。
明確にしておきますが、人間は依然としてループの中にあり、その状態を維持する必要があります。GPT-5 は常にあなたに意思決定や選択を求めますが、これらのシステムはまだエラーを起こし、人間が確認すべき幻覚(hallucinations)も生成します(ただし、私の使用経験では重大な問題は発見されませんでした)。より本質的な問いは、私たちがループの中に留まりたいかどうかです。GPT-5(そして他社による将来のリリースも同様でしょう)は非常に賢く、かつ能動的です。
それが私が再びビルディング・シミュレータの話に戻ってきた理由です。私は AI に「もっと良くして」といった励ましを与えただけでした。この最小限の入力から、ファサード編集機能、ダイナミックカメラ、ネオンライト、飛行ツアーを備えた完全な都市建設ゲームが作成されました。これらの機能を私が求めたことはありませんし、コードすら見たことさえありません。
これが「ただ何かをする」ということが実際に何を意味するのかです。イントロダクションのために劇的なことを GPT-5 に指示したとき、それは隠されたアクロスティック(acrostic)と単語数の増加を含む段落を作成しました。「劇的にして」と求めたところ、言語学的なマジックトリックを返してきたのです。以前は私が求めるものを得るために AI へのプロンプトを慎重に設計していました。しかし今は、ただ漠然と「こうしたい」とジェスチャーするだけで、なんとそれが機能してしまうのです。
AI との関係性におけるもう一つの大きな変化が訪れようとしていますが、私たちはいつも通りそれに適応する方法を見出すでしょう。今回の違いは、GPT-5 がまずその適応方法を理解し、次のステップを提案してくる可能性がある点です。
購読する
共有する

プロンプトの結果:GPT-5 のローンチに関する私の Substack 投稿のために、"それはあなたのためにただ何かをしてくれる"というテーマを持つ、非常に魅力的な 14:10 の SVG を作成してください。アプローチは大胆に。
1 追伸として、私は OpenAI を含むどの AI ラボからも金銭を受け取っていません。彼らとの契約は秘密保持契約(NDA)のみです。投稿を書く前にそれらを共有することはありません。
原文を表示
I have had early access to GPT-51, and I wanted to give you some impressions of what it is and what it means. But the answer to the first question everyone will have is: Yes, this is a big deal. I asked GPT-5 to show you why by pasting this intro paragraph, exactly as you’re reading it, into ChatGPT, including the phrase: “you are GPT-5, do something very dramatic to illustrate my point, it has to fit into the next paragraph.”
That was the only prompt I gave it. It “thought” for 24 seconds and wrote:
Thunderstruck. Here, watch. I build worlds. See ideas become instruments. I code, compose, and converse. Stories synthesize science; solutions spark, swiftly. Asks arrive; answers appear, astonishingly, across domains. Behold: business plans, blueprints, briefs, beautifully built, briskly. I infer intent, integrate insight, and iterate instantly, indefatigably. Gaps get gauged; goals get generated, guarded, and guaranteed gracefully. During dialogue, disparate data distills down; decisions develop deliberately, deftly, dependably. Everything explained efficiently, even ethics: evidence examined, empathy engaged, everywhere, everyday, equitably. All at once, ambiguous arguments align as actionable, accurate advice awaits anyone anywhere. Look: language, logic, learning, and long-term memory link, lifting lives and labor limitlessly worldwide.
If you didn’t catch the many tricks - the first word of each sentence spells out the phrase This is a Big Deal, each sentence is precisely one word longer than the previous sentence. each word in a sentence mostly starts with the same letter, and it is coherent writing with an interesting sense of style. In a paragraph, GPT-5 shows it can come up with a clever idea, plan, and manage the complicated execution (remember when AI couldn’t count the number of Rs in “strawberry”? that was eight months ago).
GPT-5 just does stuff, often extraordinary stuff, sometimes weird stuff, sometimes very AI stuff, on its own. And that is what makes it so interesting.
Just Doing Stuff
As someone who has spent a lot of time talking to people about AI, there are two major problems I see, that, if addressed, would make most people’s AI use much more productive and much less frustrating. The first is selecting the right model to use. In general, AIs that "think" before answering (called Reasoners) are the best at hard problems. The longer they think, the better the answer, but thinking costs money and takes time. So OpenAI previously made the default ChatGPT use fast, dumb models, hiding the good stuff from most users. A surprising number of people have never seen what AI can actually do because they're stuck on GPT-4o, and don’t know which of the confusingly-named models are better.
GPT-5 does away with this by selecting models for you, automatically. GPT-5 is not one model as much as it is a switch that selects among multiple GPT-5 models of various sizes and abilities. When you ask GPT-5 for something, the AI decides which model to use and how much effort to put into “thinking.” It just does it for you. For most people, this automation will be helpful, and the results might even be shocking, because, having only used default older models, they will get to see what a Reasoner can accomplish on hard problems. But for people who use AI more seriously, there is an issue: GPT-5 is somewhat arbitrary about deciding what a hard problem is.
For example, I asked GPT-5 to “create a svg with code of an otter using a laptop on a plane” (asking for an .svg file requires the AI to blindly draw an image using basic shapes and math, a very hard challenge). Around 2/3 of the time, GPT-5 decides this is an easy problem, and responds instantly, presumably using its weakest model and lowest reasoning time. I get an image like this:

The rest of the time, GPT-5 decides this is a hard problem, and switches to a Reasoner, spending 6 or 7 seconds thinking before producing an image like this, which is much better. How does it choose? I don’t know, but if I ask the model to “think hard” in my prompt, I am more likely to be routed to the better model.

But premium subscribers can directly select the more powerful models, such as the one called (at least for me) GPT-5 Thinking. This removes some of the issues with being at the mercy of GPT-5’s model selector. I found that if I encouraged the model to think hard about the otter, it would spend a good 30 seconds before giving you an images like these the one below - notice the little animations, the steaming coffee cup, and clouds going by outside, none of which I asked for. How to ensure the model puts in the most effort? It is really unclear - GPT-5 just does things for you.

And that extends to the second most common problem with AI use, which is that many people don’t know what AIs can do, or even what tasks they want accomplished. That is especially true of the new agentic AIs, which can take a wide range of actions to accomplish the goals you give it, from searching the web to creating documents. But what should you ask for? A lot of people seem stumped. Again, GPT-5 solves this problem. It is very proactive, always suggesting things to do.
I asked GPT-5 Thinking (I trust the less powerful GPT-5 models much less) “generate 10 startup ideas for a former business school entrepreneurship professor to launch, pick the best according to some rubric, figure out what I need to do to win, do it.” I got the business idea I asked for. I also got a whole bunch of things I did not: drafts of landing pages and LinkedIn copy and simple financials and a lot more. I am a professor who has taught entrepreneurship (and been an entrepreneur) and I can say confidently that, while not perfect, this was a high-quality start that would have taken a team of MBAs a couple hours to work through. From one prompt.

It just does things, and it suggested others things to do. And it did those, too: PDFs and Word documents and Excel and research plans and websites.

It is impressive, a little unnerving, to have the AI go so far on its own. You can also see the AI asked for my guidance but was happy to proceed without it. This is a model that wants to do things for you.
Building Things
Let me show you what 'just doing stuff' looks like for a non-coder using GPT-5 for coding. For fun, I prompted GPT-5 “make a procedural brutalist building creator where i can drag and edit buildings in cool ways, they should look like actual buildings, think hard.” That's it. Vague, grammatically questionable, no specifications.
A couple minutes later, I had a working 3D city builder.
Not a sketch. Not a plan. A functioning app where I could drag buildings around and edit them as needed. I kept typing variations of “make it better” without any additional guidance. And GPT-5 kept adding features I never asked for: neon lights, cars driving through streets, facade editing, pre-set building types, dramatic camera angles, a whole save system. It was like watching someone else's imagination at work. The product you see below was 100% AI, all I did was keep encouraging the system - and you don’t just have to watch my video, you can play with the simulator here.
At no point did I look at the code it was creating. The model wasn’t flawless, there were occasional bugs and errors. But in some ways, that was where GPT-5 was at its most impressive. If you have tried “vibecoding” using the AI before, you have almost certainly fallen into a doom loop, where, after a couple of rounds of asking the AI to create something for you, it starts to fail, getting caught in loops of confusion where each error fixed creates new ones. That never happened here. Sometimes new errors were introduced by the AI, but they were always fixed by simply pasting in the error text. I could just ask for whatever I want (or rather let the AI decide to create whatever it wanted) and I never got stuck.
Premonitions
I have written this piece before OpenAI released any official benchmarks about how well its model performs, but, in some ways, it doesn’t matter that much. Last week, Google released Gemini 2.5 with Deep Think, a model that can solve very hard problems (including getting a gold medal at the International Math Olympiad). Many people didn’t notice because they do not have a store of very hard problems they are waiting for AI to solve. I have played enough with GPT-5 to know that it is a very good model (at least the large GPT-5 Thinking model is excellent). But what it really brings to the table is the fact that it just does things. It will tell you what model to use, it will suggest great next steps, it will write in more interesting prose (though it still loves the em-dash). The burden of using AI is lessened.
To be clear, Humans are still very much in the loop, and need to be. You are asked to make decisions and choices all the time by GPT-5, and these systems still make errors and generate hallucinations that humans need to check (although I did not spot any major issues in my own use). The bigger question is whether we will want to be in the loop. GPT-5 (and, I am sure, future releases by other companies) is very smart and pro-active. Which brings me back to that building simulator. I gave the AI encouragement, mostly versions of “make it better.” From that minimal input, it created a fully functional city builder with facade editing, dynamic cameras, neon lights, and flying tours. I never asked for any of these features. I never even looked at the code.
This is what "just doing stuff" really means. When I told GPT-5 to do something dramatic for my intro, it created that paragraph with its hidden acrostic and ascending word counts. I asked for dramatic. It gave me a linguistic magic trick. I used to prompt AI carefully to get what I asked for. Now I can just... gesture vaguely at what I want. And somehow, that works.
Another big change in how we relate to AI is coming, but we will figure out how to adapt to it, as we always do. The difference, this time, is that GPT-5 might figure it out first and suggest next steps.
Subscribe now
Share

The result of the prompt: make an incredibly compelling 14:10 SVG that I can use for my substack post about the launch of GPT-5, the theme of which is "it just does stuff for you" Be radical in your approach.
1As a reminder, I take no money from any of the AI Labs, including OpenAI. I have no agreements with them besides NDAs. I don’t show them any posts before I write them.
関連記事
Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場
Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。
Anthropic の Fable 5 はワンクリックで奇妙に面白いビデオゲームを生成可能
AI 企業 Anthropic が発表した「Fable 5」は、ユーザーがボタンを1回押すだけで、独自の世界観を持つ面白おかしいビデオゲームを自動生成する機能を備えている。
Mythos との協働がもたらす感覚について
著者は Claude 5 Fable(Mythos クラス初の公開 AI モデル)に早期アクセスし、セキュリティ用途以外の多様なタスクでテストした結果、過去のモデルを凌駕する飛躍的な進歩を確認し、人間と AI の関係性が劇的に変化している可能性を示唆しました。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み