Mass Intelligence｜マス・インテリジェンスの時代 | AIニュース最前線

10 億人以上の人々が AI チャットボットを定期的に利用しています。ChatGPT の週次利用者数は 7 億人を超え、Gemini やその他の主要な AI も数億人を加えています。私の投稿では、AI が達成している進歩（例えば、ここ数週間で OpenAI と Google の AI チャットボットが国際数学オリンピックで金メダルを獲得するなど）に焦点を当てることが多いですが、それはより広範な変化を見えにくくしています：私たちは「マス・インテリジェンス（Mass Intelligence）」の時代へと入りつつあり、強力な AI が Google 検索と同じようにアクセス可能になりつつあります。 最近まで、これらのシステムの無料ユーザー（圧倒的多数）は、頻繁に誤りを犯し、複雑な作業には利用価値が限られる、古く小型の AI モデルにしかアクセスできませんでした。非常に難しい問題を解決でき、ハルシネーション（幻覚的な出力）が大幅に少ない Reasoners などの最良モデルを利用するには、月額 20 ドルから 200 ドルの支払いが必要でした。しかも、どのモデルを選ぶべきか、どのようにプロンプトを適切に入力するかを知る必要がありました。しかし、経済構造とインターフェースは急速に変化しており、私たちが働き、学び、思考する方法に大きな影響を与えています。 強力な AI がより安価かつアクセスしやすくなっている 強力な AI にアクセスする上で、ほとんどのユーザーにとって二つの障壁がありました。一つ目は混乱です。AI モデルを選択すべきだと知っている人はほとんどいませんでした。さらに少ない人数が、ChatGPT のメニューから o3 を選択すれば優れた推論型 AI モデルにアクセスできる一方、より高い数字に見える 4o を選んでもはるかに能力の低いものしか得られないことを知っていました。OpenAI によると、有料顧客の 7% 未満が定期的に o3 を選択しており、これはパワーユーザーでさえも推論型モデルができることの恩恵を受けていなかったことを意味します。 もう一つの要因はコストです。最良のモデルは高価であるため、無料ユーザーにはアクセス権が与えられないか、非常に限定的なアクセスしか認められていませんでした。Google は自社の最良モデルの一部に無料でアクセスできる道を開きましたが、OpenAI は GPT-5 のローンチ以前は、ほぼすべての無料顧客が推論型モデルを定期的に利用できなかったと述べています。 GPT-5 はこれらの二つの問題を解決するはずでしたが、これがデビューが非常に混乱し、わかりにくかった理由の一部です。GPT-5 は実は二つのものを指しています。それは、弱い GPT-5 Nano から強力な GPT-5 Pro まで、非常に異なるモデルのファミリー全体の名称でした。また、どのモデルを使用するか、そして AI が問題を解決するためにどれだけの計算リソース（computing power）を投入すべきかを決定するツールの名前でもありました。「GPT-5」に書き込むとき、実際には、あなたの問題がより小さく高速なモデルで解決できるか、それともより強力な推論型モデルが必要かを自動的に判断するルーターと対話していることになります。 ChatGPT-5 を選択すると、実際には「自動モード」を選択することになります。このモードでは、世界中で最も優れたモデルの一つであるものもあれば、はるかに弱いモデルもある、さまざまな ChatGPT-5 モデルの中から自動的に選択されます。 有料アクセスを利用する場合は、単純なチャット以外のほぼすべての問題に対して、「GPT-5 Thinking」を選択してください。 これは、強力な AI へのアクセスをより多くのユーザーに拡大させる意図でした。つまり、単にチャットしたいだけなら GPT-5 はそのための弱めの専門チャットモデルを使用し、数学の問題を解こうとしている場合は、より遅く、コストのかかる「GPT-5 Thinking」モデルへ誘導する仕組みでした。これにより費用が節約され、より多くの人々が最高の AI にアクセスできるようになるはずでした。 しかし、この導入には課題がありました。この運用方法が十分に説明されておらず、ルーティング機能も当初はうまく動作しませんでした。その結果、GPT-5 を使用したあるユーザーには非常に賢明な回答が返された一方で、別のユーザーには不適切な回答しか得られなかったのです。 これらの課題にもかかわらず、OpenAI は初期段階で成功を報告しました。ローンチから数日以内に、推論機能（Reasoner）を利用した有料顧客の割合は 7% から 24% に上昇し、最も強力なモデルを利用する無料顧客の数もほぼゼロから 7% へと増加しました。 この変化の一部は、より賢いモデルの実行効率が劇的に向上しているという事実によって推進されています。このグラフは、この傾向がどの程度急速に進行したかを示しており、縦軸に AI の能力を、横軸には対数関数的に減少するコストをプロットしています。GPT-4 が登場した際、100 万トークン（トークンはおよそ単語 1 つに相当します）あたりの利用料金は約 50 ドルでしたが、現在では GPT-5 nano を使用する場合、100 万トークンあたり約 14 セントで済みます。これは元の GPT-4 よりもはるかに能力の高いモデルです。 ![image](https://substackcdn.com/image/fetch/$s_!Kn3w!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbc777761-5ac9-4380-b78d-2216a9835b13_1886x1360.png) 大学院レベルの Google 対策 Q&A テスト（GPQA）は、高度な知識をテストするために設計された非常に難しい選択式問題のシリーズです。インターネットにアクセスできる非専門家は正答率 34%、インターネットにアクセスできる博士号取得者は専門分野内で 74-81% の正答率を示します。100 万トークンあたりのコストは、そのモデルを利用する際の費用を意味します。（私はこのデータを収集したため、誤りがある場合はご容赦ください。） この効率化の恩恵は金銭的なものだけでなく、環境面でも大きなものです。Google は、過去 1 年だけでプロンプトあたりのエネルギー効率が 33 倍に向上したと報告しています。2025 年の現代的な大規模言語モデル（LLM）における標準的なプロンプトが消費する限界エネルギー量は、独立したテスト結果および公式発表の両方から、すでに比較的明確に確立されています。これはおよそ 0.0003 キロワット時（kWh）で、Netflix をストリーミング再生している 8〜10 秒分の電力使用量や、2008 年の Google 検索に相当するエネルギー量と同等です（興味深いことに、画像生成もテキストプロンプトと同程度のエネルギーを使用するようです）1。一方、プロンプトあたりの水使用量はより不透明で、水の定義によって数滴からショットグラスの 5 分の 1（0.25mL〜5mL 以上）まで幅があり、ここでは低水使用説と高水使用説の両方の議論が存在します。 これらの改善により、AI がさらに強力になるにつれて、より多くの人々に提供することが現実的なものとなっています。追加ユーザー 1 人あたりのサービスにかかる限界コストが劇的に低下したため、広告支援のような新たなビジネスモデルが可能になりました。無料ユーザーも、2 年前であれば数ドルの費用がかかっていたようなプロンプトを今では実行できるようになっています。これが、突然数十億人が強力な AI にアクセスできるようになる仕組みです。これは大規模な民主化イニシアチブによるものではなく、経済的な合理性がついにそれを可能にした結果なのです。 強力な AI が使いやすくなっている 強力な AI にアクセスできるだけでは不十分です。人々は実際にそれを使って何かを成し遂げる必要があります。AI をうまく使うことは、以前は非常に困難なプロセスでした。これには、思考の連鎖（chain-of-thought）などのテクニックを用いてプロンプトを作成したり、AI から最大限の効果を引き出すためのコツやトリックを学んだりする必要がありました。しかし、最近の一連の実験において、これらのテクニックはもはや本当に役立たないことがわかりました。強力な AI モデルは、単に指示されたことを実行するだけでなく、ユーザーが何を望んでいるかを理解し、さらには要求を超えたことまで行う能力が向上しています（なお、脅したり親切に接したりしても、平均的には効果がないようです）。 テキストモデルだけが安価で使いやすくなっているわけではありません。Google は、コードネーム「nano banana」、公式名称は Gemini 2.5 Flash Image Generator という新しい画像生成モデルをリリースしました。このモデルは非常に優秀であり（ただし、新規作成よりも画像編集の方が得意です）、無料ユーザーでもアクセスできるほど低コストです。また、以前の世代の AI 画像生成器とは異なり、平易な自然言語による指示を非常に良く守ります。 その威力と使いやすさの一例として、アポロ11号の宇宙飛行士を描いた象徴的かつ著作権フリーの画像と、キラキラしたタキシードの写真のランダムな画像をアップロードし、最もシンプルなプロンプトを与えました：「左側のニール・アームストロングにこのタキシードを着せてください」 ![image](https://substackcdn.com/image/fetch/$s_!zmP2!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F6b305085-662d-4190-bea2-ad4fd8b76fa9_1896x828.png) 数秒後に得られた結果がこちらです: ![image](https://substackcdn.com/image/fetch/$s_!dLl6!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F80f4d0d5-9a57-4444-9c07-c471f2a0abc5_1024x1024.png) 専門家なら見逃さないような問題点もいくつか存在しますが、タキシードのリアルなしわや、それがシーンにどのように溶け込んでいるかを見ると感心させられます（ラペルについた NASA のピンバッジは良いアクセントでした）。AI 画像編集プロセスには依然として多くのランダム性が含まれており、多くの専門用途には適していませんが、一般の人々にとっては、単に何ができるかというだけでなく、その作業がいかに容易になったかにおいて、大きな飛躍を意味しています。 そして、さらに先へ進むことも可能です：「同じ衣装を着たニール・アームストロングとバズ・オルドリンが、現代的な飛行機の座席に座っている写真を見せてください。ニールはリラックスして後ろに身を預け、トランペットを吹いています。バズは不安そうでハンバーガーを持っています。真ん中の席には、リアルなカワウソが座席に座り、ラップトップを使用しています。」 これは多くのことを示しています：AI からの非常に印象的な出力です（表情や、バズのリングとニールのラペルピンがどのように保持されているかをご覧ください）。これは AI によって可能になった歴史の有名な瞬間の変形であり、これらの技術が広く使用されたときに何がどれほど奇妙になるかについての潜在的な警告でもあります。 マス・インテリジェンスの奇妙さ 強力な AI が数十億人の手に渡ったとき、多くのことが同時に起こります。実際、すでに多くのことが同時に進行しています。 一部の人は AI モデルと強烈な関係を築いていますが、他の人々は孤独から救われています。AI モデルは、ある人々には精神的な崩壊や危険な行動を引き起こす一方で、別の人の病気の診断に利用されています。讣報の作成、聖典の生成、宿題の不正行為、新事業の立ち上げなど、数千もの予期せぬ用途にも使われています。これらの用途と、それに伴う問題と利益は、AI システムがより強力になるにつれてさらに増大する可能性が高いです。 Google の AI 画像ジェネレーターには誤用の制限を設けるガードレールや、AI 生成画像を識別するための不可視の透かし（watermark）がありますが、今後数ヶ月のうちに、はるかに制限の少ない AI 画像ジェネレーターが「ナノバナナ」レベルの品質に近づくと予想しています。 AI 企業（安全性へのコミットメントを信じるかどうかにかかわらず）は、私たち一般の人々と同様に、この状況を吸収することができないようです。10 億人が高度な AI にアクセスできるようになったとき、私たちは「マス・インテリジェンスの時代」と呼ぶことができる段階に足を踏み入れました。私たちが持つすべての機関——学校、病院、裁判所、企業、政府——は、知能が希少で高価だった世界のために構築されたものです。今や、あらゆる職業、あらゆる機関、あらゆるコミュニティが、マス・インテリジェンスを活用して繁栄する方法を考え出す必要があります。10 億人が AI を利用するのをどう活用し、それに伴う混乱をどう管理するか？誰もが何でも捏造できる状況で信頼をどう再構築するか？知識へのアクセスを民主化しながら、人間の専門性の価値ある部分をどう守るか？ さて、ここにあります。強力な AI は安価すぎて無料で提供でき、マニュアルがなくても使えるほど簡単で、知的タスクの範囲において人間を上回る能力を持っています。教室、裁判所、役員会室など、世界中のあらゆる場所で、機会と問題の洪水が押し寄せようとしています。マス・インテリジェンスの時代とは、10 億人に前例のないツールセットへのアクセスを与え、彼らがそれを使って何をするかを見てみせることです。私たちはそれがどのようなものかをまさにこれから知るのです。 購読する 共有する ![image](https://substackcdn.com/image/fetch/$s_!YEXj!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F1cec29eb-e93d-4e77-9ca2-2ebf86d7002c_1376x864.png) これは標準的なプロンプトに応答するために必要なエネルギーです。ただし、AI モデルのトレーニングに要するエネルギーは考慮されていません。トレーニングは一度きりのプロセスであり、非常に多くのエネルギーを消費します。現代のモデルを作成するためにどれほどのエネルギーが使われているかは不明ですが、GPT-4 のトレーニングには約 500,000 kWh（飛行中のボーイング 737 が約 18 時間飛行する際のエネルギー量に相当）が要したと推定されています。

マス・インテリジェンスの時代

背景や根拠まで確認しますか？

関連記事

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する