マス・インテリジェンスの時代
One Useful Thing は、AI が「検索のように手軽に」なりつつある「マス・インテリジェンス」時代への移行と、OpenAI の GPT-5 がモデル選択の複雑さを解消する自動ルーターとして機能し始めた点を分析している。
キーポイント
マス・インテリジェンス時代の到来
強力な AI が Google 検索のように一般ユーザーにアクセス可能になる転換点であり、以前は有料モデルに限られていた高性能推論能力が広く普及し始めている。
GPT-5 の二重定義と自動ルーティング
GPT-5 は単一のモデルではなく、弱めの Nano から強力な Pro までを含むファミリー名であり、同時にユーザーのタスクに応じて最適なモデルを自動的に選択・割り当てるルーター機能を持つ。
利用障壁の解消と混乱
以前はどのモデルを選べばよいかという「混乱」と、高性能モデルの高コストが障壁だったが、GPT-5 の登場で自動モード(Auto mode)によりこれらの課題が部分的に解決された。
GPT-5 の自動モードと Thinking モードの使い分け
無料または有料プランでは、単純なチャットには軽量モデルが、複雑な問題解決には高性能な「GPT-5 Thinking」モデルが自動的に選択される仕組みだが、初期のルーティング不具合により回答品質にばらつきがあった。
AI モデルのコストと効率性の劇的な向上
GPT-4 時代と比較して GPT-5 nano の使用コストは数百万トークンあたり約$50から14セントへと激減しており、能力が向上する一方でランニングコストが大幅に削減されている。
環境への影響とエネルギー効率の改善
最新の LLM はプロンプトあたりのエネルギー効率が前年比で33倍向上し、1回の標準的なプロンプト処理に必要な電力は Netflix を数秒視聴する程度に抑えられている。
AI の経済的民主化
追加ユーザーへの提供コストが劇的に低下したため、広告収益モデルなどを通じて数億人が以前は高額だった強力な AI に無料でアクセスできるようになった。
影響分析・編集コメントを表示
影響分析
この変化は、AI の利用が専門家の特権から一般大衆の日常ツールへと急速にシフトする決定的な転換点を示しています。企業や個人にとって、複雑なモデル選定コストが下がることで、業務効率化や学習プロセスにおける AI 活用率がさらに加速すると予想されます。
編集コメント
「GPT-5」という名称が単なるバージョンアップではなく、背後にある複雑なモデル選択を隠蔽するインターフェースの進化を象徴している点が興味深いです。
10 億人以上の人々が AI チャットボットを定期的に利用しています。ChatGPT の週次利用者数は 7 億人を超え、Gemini やその他の主要な AI も数億人を加えています。私の投稿では、AI が達成している進歩(例えば、ここ数週間で OpenAI と Google の AI チャットボットが国際数学オリンピックで金メダルを獲得するなど)に焦点を当てることが多いですが、それはより広範な変化を見えにくくしています:私たちは「マス・インテリジェンス(Mass Intelligence)」の時代へと入りつつあり、強力な AI が Google 検索と同じようにアクセス可能になりつつあります。
最近まで、これらのシステムの無料ユーザー(圧倒的多数)は、頻繁に誤りを犯し、複雑な作業には利用価値が限られる、古く小型の AI モデルにしかアクセスできませんでした。非常に難しい問題を解決でき、ハルシネーション(幻覚的な出力)が大幅に少ない Reasoners などの最良モデルを利用するには、月額 20 ドルから 200 ドルの支払いが必要でした。しかも、どのモデルを選ぶべきか、どのようにプロンプトを適切に入力するかを知る必要がありました。しかし、経済構造とインターフェースは急速に変化しており、私たちが働き、学び、思考する方法に大きな影響を与えています。
強力な AI がより安価かつアクセスしやすくなっている
強力な AI にアクセスする上で、ほとんどのユーザーにとって二つの障壁がありました。一つ目は混乱です。AI モデルを選択すべきだと知っている人はほとんどいませんでした。さらに少ない人数が、ChatGPT のメニューから o3 を選択すれば優れた推論型 AI モデルにアクセスできる一方、より高い数字に見える 4o を選んでもはるかに能力の低いものしか得られないことを知っていました。OpenAI によると、有料顧客の 7% 未満が定期的に o3 を選択しており、これはパワーユーザーでさえも推論型モデルができることの恩恵を受けていなかったことを意味します。
もう一つの要因はコストです。最良のモデルは高価であるため、無料ユーザーにはアクセス権が与えられないか、非常に限定的なアクセスしか認められていませんでした。Google は自社の最良モデルの一部に無料でアクセスできる道を開きましたが、OpenAI は GPT-5 のローンチ以前は、ほぼすべての無料顧客が推論型モデルを定期的に利用できなかったと述べています。
GPT-5 はこれらの二つの問題を解決するはずでしたが、これがデビューが非常に混乱し、わかりにくかった理由の一部です。GPT-5 は実は二つのものを指しています。それは、弱い GPT-5 Nano から強力な GPT-5 Pro まで、非常に異なるモデルのファミリー全体の名称でした。また、どのモデルを使用するか、そして AI が問題を解決するためにどれだけの計算リソース(computing power)を投入すべきかを決定するツールの名前でもありました。「GPT-5」に書き込むとき、実際には、あなたの問題がより小さく高速なモデルで解決できるか、それともより強力な推論型モデルが必要かを自動的に判断するルーターと対話していることになります。
ChatGPT-5 を選択すると、実際には「自動モード」を選択することになります。このモードでは、世界中で最も優れたモデルの一つであるものもあれば、はるかに弱いモデルもある、さまざまな ChatGPT-5 モデルの中から自動的に選択されます。
有料アクセスを利用する場合は、単純なチャット以外のほぼすべての問題に対して、「GPT-5 Thinking」を選択してください。
これは、強力な AI へのアクセスをより多くのユーザーに拡大させる意図でした。つまり、単にチャットしたいだけなら GPT-5 はそのための弱めの専門チャットモデルを使用し、数学の問題を解こうとしている場合は、より遅く、コストのかかる「GPT-5 Thinking」モデルへ誘導する仕組みでした。これにより費用が節約され、より多くの人々が最高の AI にアクセスできるようになるはずでした。
しかし、この導入には課題がありました。この運用方法が十分に説明されておらず、ルーティング機能も当初はうまく動作しませんでした。その結果、GPT-5 を使用したあるユーザーには非常に賢明な回答が返された一方で、別のユーザーには不適切な回答しか得られなかったのです。
これらの課題にもかかわらず、OpenAI は初期段階で成功を報告しました。ローンチから数日以内に、推論機能(Reasoner)を利用した有料顧客の割合は 7% から 24% に上昇し、最も強力なモデルを利用する無料顧客の数もほぼゼロから 7% へと増加しました。
この変化の一部は、より賢いモデルの実行効率が劇的に向上しているという事実によって推進されています。このグラフは、この傾向がどの程度急速に進行したかを示しており、縦軸に AI の能力を、横軸には対数関数的に減少するコストをプロットしています。GPT-4 が登場した際、100 万トークン(トークンはおよそ単語 1 つに相当します)あたりの利用料金は約 50 ドルでしたが、現在では GPT-5 nano を使用する場合、100 万トークンあたり約 14 セントで済みます。これは元の GPT-4 よりもはるかに能力の高いモデルです。

大学院レベルの Google 対策 Q&A テスト(GPQA)は、高度な知識をテストするために設計された非常に難しい選択式問題のシリーズです。インターネットにアクセスできる非専門家は正答率 34%、インターネットにアクセスできる博士号取得者は専門分野内で 74-81% の正答率を示します。100 万トークンあたりのコストは、そのモデルを利用する際の費用を意味します。(私はこのデータを収集したため、誤りがある場合はご容赦ください。)
この効率化の恩恵は金銭的なものだけでなく、環境面でも大きなものです。Google は、過去 1 年だけでプロンプトあたりのエネルギー効率が 33 倍に向上したと報告しています。2025 年の現代的な大規模言語モデル(LLM)における標準的なプロンプトが消費する限界エネルギー量は、独立したテスト結果および公式発表の両方から、すでに比較的明確に確立されています。これはおよそ 0.0003 キロワット時(kWh)で、Netflix をストリーミング再生している 8〜10 秒分の電力使用量や、2008 年の Google 検索に相当するエネルギー量と同等です(興味深いことに、画像生成もテキストプロンプトと同程度のエネルギーを使用するようです)1。一方、プロンプトあたりの水使用量はより不透明で、水の定義によって数滴からショットグラスの 5 分の 1(0.25mL〜5mL 以上)まで幅があり、ここでは低水使用説と高水使用説の両方の議論が存在します。
これらの改善により、AI がさらに強力になるにつれて、より多くの人々に提供することが現実的なものとなっています。追加ユーザー 1 人あたりのサービスにかかる限界コストが劇的に低下したため、広告支援のような新たなビジネスモデルが可能になりました。無料ユーザーも、2 年前であれば数ドルの費用がかかっていたようなプロンプトを今では実行できるようになっています。これが、突然数十億人が強力な AI にアクセスできるようになる仕組みです。これは大規模な民主化イニシアチブによるものではなく、経済的な合理性がついにそれを可能にした結果なのです。
強力な AI が使いやすくなっている
強力な AI にアクセスできるだけでは不十分です。人々は実際にそれを使って何かを成し遂げる必要があります。AI をうまく使うことは、以前は非常に困難なプロセスでした。これには、思考の連鎖(chain-of-thought)などのテクニックを用いてプロンプトを作成したり、AI から最大限の効果を引き出すためのコツやトリックを学んだりする必要がありました。しかし、最近の一連の実験において、これらのテクニックはもはや本当に役立たないことがわかりました。強力な AI モデルは、単に指示されたことを実行するだけでなく、ユーザーが何を望んでいるかを理解し、さらには要求を超えたことまで行う能力が向上しています(なお、脅したり親切に接したりしても、平均的には効果がないようです)。
テキストモデルだけが安価で使いやすくなっているわけではありません。Google は、コードネーム「nano banana」、公式名称は Gemini 2.5 Flash Image Generator という新しい画像生成モデルをリリースしました。このモデルは非常に優秀であり(ただし、新規作成よりも画像編集の方が得意です)、無料ユーザーでもアクセスできるほど低コストです。また、以前の世代の AI 画像生成器とは異なり、平易な自然言語による指示を非常に良く守ります。
その威力と使いやすさの一例として、アポロ11号の宇宙飛行士を描いた象徴的かつ著作権フリーの画像と、キラキラしたタキシードの写真のランダムな画像をアップロードし、最もシンプルなプロンプトを与えました:「左側のニール・アームストロングにこのタキシードを着せてください」

数秒後に得られた結果がこちらです:

専門家なら見逃さないような問題点もいくつか存在しますが、タキシードのリアルなしわや、それがシーンにどのように溶け込んでいるかを見ると感心させられます(ラペルについた NASA のピンバッジは良いアクセントでした)。AI 画像編集プロセスには依然として多くのランダム性が含まれており、多くの専門用途には適していませんが、一般の人々にとっては、単に何ができるかというだけでなく、その作業がいかに容易になったかにおいて、大きな飛躍を意味しています。
そして、さらに先へ進むことも可能です:「同じ衣装を着たニール・アームストロングとバズ・オルドリンが、現代的な飛行機の座席に座っている写真を見せてください。ニールはリラックスして後ろに身を預け、トランペットを吹いています。バズは不安そうでハンバーガーを持っています。真ん中の席には、リアルなカワウソが座席に座り、ラップトップを使用しています。」
これは多くのことを示しています:AI からの非常に印象的な出力です(表情や、バズのリングとニールのラペルピンがどのように保持されているかをご覧ください)。これは AI によって可能になった歴史の有名な瞬間の変形であり、これらの技術が広く使用されたときに何がどれほど奇妙になるかについての潜在的な警告でもあります。
マス・インテリジェンスの奇妙さ
強力な AI が数十億人の手に渡ったとき、多くのことが同時に起こります。実際、すでに多くのことが同時に進行しています。
一部の人は AI モデルと強烈な関係を築いていますが、他の人々は孤独から救われています。AI モデルは、ある人々には精神的な崩壊や危険な行動を引き起こす一方で、別の人の病気の診断に利用されています。讣報の作成、聖典の生成、宿題の不正行為、新事業の立ち上げなど、数千もの予期せぬ用途にも使われています。これらの用途と、それに伴う問題と利益は、AI システムがより強力になるにつれてさらに増大する可能性が高いです。
Google の AI 画像ジェネレーターには誤用の制限を設けるガードレールや、AI 生成画像を識別するための不可視の透かし(watermark)がありますが、今後数ヶ月のうちに、はるかに制限の少ない AI 画像ジェネレーターが「ナノバナナ」レベルの品質に近づくと予想しています。
AI 企業(安全性へのコミットメントを信じるかどうかにかかわらず)は、私たち一般の人々と同様に、この状況を吸収することができないようです。10 億人が高度な AI にアクセスできるようになったとき、私たちは「マス・インテリジェンスの時代」と呼ぶことができる段階に足を踏み入れました。私たちが持つすべての機関——学校、病院、裁判所、企業、政府——は、知能が希少で高価だった世界のために構築されたものです。今や、あらゆる職業、あらゆる機関、あらゆるコミュニティが、マス・インテリジェンスを活用して繁栄する方法を考え出す必要があります。10 億人が AI を利用するのをどう活用し、それに伴う混乱をどう管理するか?誰もが何でも捏造できる状況で信頼をどう再構築するか?知識へのアクセスを民主化しながら、人間の専門性の価値ある部分をどう守るか?
さて、ここにあります。強力な AI は安価すぎて無料で提供でき、マニュアルがなくても使えるほど簡単で、知的タスクの範囲において人間を上回る能力を持っています。教室、裁判所、役員会室など、世界中のあらゆる場所で、機会と問題の洪水が押し寄せようとしています。マス・インテリジェンスの時代とは、10 億人に前例のないツールセットへのアクセスを与え、彼らがそれを使って何をするかを見てみせることです。私たちはそれがどのようなものかをまさにこれから知るのです。
購読する
共有する

これは標準的なプロンプトに応答するために必要なエネルギーです。ただし、AI モデルのトレーニングに要するエネルギーは考慮されていません。トレーニングは一度きりのプロセスであり、非常に多くのエネルギーを消費します。現代のモデルを作成するためにどれほどのエネルギーが使われているかは不明ですが、GPT-4 のトレーニングには約 500,000 kWh(飛行中のボーイング 737 が約 18 時間飛行する際のエネルギー量に相当)が要したと推定されています。
原文を表示
More than a billion people use AI chatbots regularly. ChatGPT has over 700 million weekly users. Gemini and other leading AIs add hundreds of millions more. In my posts, I often focus on the advances that AI is making (for example, in the past few weeks, both OpenAI and Google AIs chatbots got gold medals in the International Math Olympiad), but that obscures a broader shift that's been building: we're entering an era of Mass Intelligence, where powerful AI is becoming as accessible as a Google search.
Until recently, free users of these systems (the overwhelming majority) had access only to older, smaller AI models that frequently made mistakes and had limited use for complex work. The best models, like Reasoners that can solve very hard problems and hallucinate much less often, required paying somewhere between $20 and $200 a month. And even then, you needed to know which model to pick and how to prompt it properly. But the economics and interfaces are changing rapidly, with fairly large consequences for how all of us work, learn, and think.
Powerful AI is Getting Cheaper and Easier to Access
There have been two barriers to accessing powerful AI for most users. The first was confusion. Few people knew to select an AI model. Even fewer knew that picking o3 from a menu in ChatGPT would get them access to an excellent Reasoner AI model, while picking 4o (which seems like a higher number) would give them something far less capable. According to OpenAI, less than 7% of paying customers selected o3 on a regular basis, meaning even power users were missing out on what Reasoners could do.
Another factor was cost. Because the best models are expensive, free users were often not given access to them, or else given very limited access. Google led the way in giving some free access to its best models, but OpenAI stated that almost none of its free customers had regular access to reasoning models prior to the launch of GPT-5.
GPT-5 was supposed to solve both of these problems, which is partially why its debut was so messy and confusing. GPT-5 is actually two things. It was the overall name for a family of quite different models, from the weaker GPT-5 Nano to the powerful GPT-5 Pro. It was also the name given to the tool that picked which model to use and how much computing power the AI should use to solve your problem. When you are writing to “GPT-5” you are actually talking to a router that is supposed to automatically decide whether your problem can be solved by a smaller, faster model or needs to go to a more powerful Reasoner.

When you pick ChatGPT 5 you are actually picking Auto mode, which selects among the various ChatGPT 5 models, some of which are among the best models in the world, some of which are much weaker. If you pay for access, select “GPT-5 Thinking” for almost any problem beyond a simple chat.
You could see how this was supposed to expand access to powerful AI to more users: if you just wanted to chat, GPT-5 was supposed to use its weaker specialized chat models; if you were trying to solve a math problem, GPT-5 was supposed to send you to its slower, more expensive GPT-5 Thinking model. This would save money and give more people access to the best AIs. But the rollout had issues. This practice wasn’t well explained and the router did not work well at first. The result is that one person using GPT-5 got a very smart answer while another got a bad one. Despite these issues, OpenAI reported early success. Within a few days of launch, the percentage of paying customers who had used a Reasoner went from 7% to 24% and the number of free customers using the most powerful models went from almost zero to 7%.
Part of this change is driven by the fact that smarter models are getting dramatically more efficient to run. This graph shows how fast this trend has played out, mapping the capability of AI on the y-axis and the logarithmically decreasing costs on the x-axis. When GPT-4 came out it was around $50 to work with a million tokens (a token is roughly a word), now it costs around 14 cents per million tokens to use GPT-5 nano, a much more capable model than the original GPT-4.

The Graduate-Level Google-Proof Q&A test (GPQA) is a series of very hard multiple-choice problems designed to test advanced knowledge. non-experts with access to the internet get 34% right, PhDs with internet access get 74-81% inside their specialty. The cost per million tokens is the cost of using the model. (I gathered this data, so apologies for any errors.)
This efficiency gain isn't just financial, it's also environmental. Google has reported that energy efficiency per prompt has improved by 33x in the last year alone. The marginal energy used by a standard prompt from a modern LLM in 2025 is relatively established at this point, from both independent tests and official announcements. It is roughly 0.0003 kWh, the same energy use as 8-10 seconds of streaming Netflix or the equivalent of a Google search in 2008 (interestingly, image creation seems to use a similar amount of energy as a text prompt)1. How much water these models use per prompt is less clear but ranges from a few drops to a fifth of a shot glass (.25mL to 5mL+), depending on the definitions of water use (here is the low water argument and the high water argument).
These improvements mean that even as AI gets more powerful, it's also becoming viable to give to more people. The marginal cost of serving each additional user has collapsed, which means more business models, like ad support, become possible. Free users can now run prompts that would have cost dollars just two years ago. This is how a billion people suddenly get access to powerful AIs: not through some grand democratization initiative, but because the economics finally make it possible.
Powerful AI is Getting Easy to Use
Getting access to a powerful AI is not enough, people need to actually use it to get things done. Using AI well used to be a pretty challenging process which involved crafting a prompt using techniques like chain-of-thought along with learning tips and tricks to get the most out of your AI. In a recent series of experiments, however, we have discovered that these techniques don’t really help anymore. Powerful AI models are just getting better at doing what you ask them to or even figuring out what you want and going beyond what you ask (and no, threatening them or being nice to them does not seem to help on average).
And it isn’t just text models that are becoming cheaper and easier to use. Google released a new image model with the code name “nano banana” and the much more boring official name Gemini 2.5 Flash Image Generator. In addition to being excellent (though better at editing images than creating new ones), it is also cheap enough that free users can access it. And, unlike previous generations of AI image generators, it follows instructions in plain language very well.
As an example of both its power and ease of use, I uploaded an iconic (and copyright free) image of the Apollo 11 astronauts and a random picture of a sparkly tuxedo and gave it the simplest prompts: “dress Neil Armstrong on the left in this tuxedo”

Here is what it gave me a few seconds later:

There are issues that someone with an expert eye would spot, but it is still impressive to see the realistic folds of the tuxedo and how it is blended into the scene (the NASA pin on the lapel was a nice touch). There is still a lot of randomness in the process that makes AI image editing unsuitable for many professional applications, but for most people, this represents a huge leap in not just what they can do, but how easy it is to do it.
And we can go further: “now show a photograph where neil armstrong and buzz aldrin, in the same outfits, are sitting in their seats in a modern airplane, neil looks relaxed and is leaning back, playing a trumpet, buzz seems nervous and is holding a hamburger, in the middle seat is a realistic otter sitting in a seat and using a laptop.”

This is many things: A pretty impressive output from the AI (look at the expressions, and how it preserved Buzz’s ring and Neil’s lapel pin). A distortion of a famous moment in history made possible by AI. And a potential warning about how weird things are going to get when these sorts of technologies are used widely.
The Weirdness of Mass Intelligence
When powerful AI is in the hands of a billion people, a lot of things are going to happen at once. A lot of things are already happening at once.
Some people have intense relationships with AI models while other people are being saved from loneliness. AI models may be causing mental breakdowns and dangerous behavior for some while being used to diagnose the diseases of others. It is being used to write obituaries and create scriptures and cheat on homework and launch new ventures and thousands of other unexpected uses. These uses, and both the problems and benefits, are likely to only multiply as AI systems get more powerful.
And while Google's AI image generator has guardrails to limit misuse, as well as invisible watermarks to identify AI images, I expect much less restrictive AI image generators will likely get close to nano banana in quality in the coming months.
The AI companies (whether you believe their commitments to safety or not) seem to be as unable to absorb all of this as the rest of us are. When a billion people have access to advanced AI, we've entered what we might call the era of Mass Intelligence. Every institution we have — schools, hospitals, courts, companies, governments — was built for a world where intelligence was scarce and expensive. Now every profession, every institution, every community has to figure out how to thrive with Mass Intelligence. How do we harness a billion people using AI while managing the chaos that comes with it? How do we rebuild trust when anyone can fabricate anything? How do we preserve what's valuable about human expertise while democratizing access to knowledge?
So here we are. Powerful AI is cheap enough to give away, easy enough that you don't need a manual, and capable enough to outperform humans at a range of intellectual tasks. A flood of opportunities and problems are about to show up in classrooms, courtrooms, and boardrooms around the world. The Mass Intelligence era is what happens when you give a billion people access to an unprecedented set of tools and see what they do with it. We are about to find out what that is like.
Subscribe now
Share

1This is the energy required to answer a standard prompt. It does not take into account the energy needed to train AI models, which is a one-time process that is very energy intensive. We do not know how much energy is used to create a modern model, but it was estimated that training GPT-4 took a little above 500,000 kWh, about 18 hours of a Boeing 737 in flight.
関連記事
マイクロソフトと OpenAI の決裂後、両社は激しく対立する準備を整えた
マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。
OpenAI のアレックス・ルパスカスカ氏:GPT-5.5 の限界はさらに先へ
OpenAI の研究者アレックス・ルパスカスカ氏は、GPT-5.5 が専門的な研究論文を 30 分で再現できるなど能力が向上したと指摘し、AI を活用する人々の経験値に応じてモデルの限界が外側に広がっていると述べています。
GPT-5.4 思考システムカード
OpenAIがGPT-5.4の思考システムカードを公開し、AIモデルの内部推論プロセスを透明化する新たな説明可能性フレームワークを導入した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み