現在、AIを正しく使用するための独断的なガイド

私は数ヶ月ごとに、AI の使い方に関する意見書のようなガイドを執筆してきましたが、今回は人類の約 10% が週に一度 AI を利用する世界でそれを記しています。その利用の大半は無料の AI ツールに関わるものであり、多くの場合は問題ありません……ただし、そうでない場合もあります。OpenAI は最近、人々が実際に ChatGPT で何を行っているかという分析を発表しました（あなたが思うほどカジュアルな会話ではなく、予想以上に情報探索に用いられています）。これにより、私はようやく直感ではなく、実際の利用パターンに基づいたアドバイスを提供できるようになりました。私は OpenAI のチャートに、無料モデルと高度なモデルをいつ使い分けるべきかに関するいくつかの注釈を追加しました。 ![image](https://substackcdn.com/image/fetch/$s_!9V4E!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbbb3f806-e9b0-44f2-a384-5abe22e35ec9_1314x673.png) もしチャートから、AI を使用する目的に対して無料モデルで十分であることが示されているなら、お気に入りのものを選んで、このガイドの他のことを気にせず使用してください。実際には約 9 つの選択肢があります。なぜなら、最先端のモデルを開発している企業はほんの数社しかないからです。それらすべてが何らかの形で無料でアクセスできる機会を提供しています。最も進化した 4 つの AI システムは、Anthropic の Claude、Google の Gemini、OpenAI の ChatGPT、そして Elon Musk の xAI が提供する Grok です。その次に、オープンウェイト（weights: モデルの重みパラメータ）の AI ファミリーがあり、これらはほぼ（ただし完全にではないが）同等の性能を持っています：中国の Deepseek、Kimi、Z、Qwen、そしてフランスの Mistral です。これらの AI モデルの変種を合わせると、AI の評価システムにおいてほぼすべての場合で上位 35 位以内を占めています。Microsoft Copilot から Perplexity まで（どちらも一部無料で利用可能）最先端の AI を提供する他のどの AI サービスを利用しても、その基盤となっているのはこれら 9 つの AI のいずれかです。 それらの中からどのように選ぶべきでしょうか？Gemini や Perplexity のような一部の無料システムは Web 検索をうまくこなしますが、他のシステムの中には Web 検索自体ができないものもあります。無料で画像を作成したい場合の最良の選択肢は Gemini で、ChatGPT と Grok がそれに次ぐ候補となります。しかし、最終的にはこれらの AI は、プライバシーポリシー、アクセスレベル、機能、倫理的問題へのアプローチ、「人格」といった多くの小さな点で異なります。また、これらすべてが時間とともに変動します。したがって、これらの要素を考慮して気に入ったモデルを選び、それを使用してください。ただし、有料アカウントへのアップグレードを検討している場合は、Anthropic、Google、または OpenAI の無料アカウントから始めることをお勧めします。単に無料モデルを利用したいだけなら、Microsoft Copilot などのオープンウェイトモデルや集約サービスの方が利用制限が緩やかです。 さて、本題に入りましょう。 高度な AI システムの選定 高度な AI を真剣に活用したいのであれば、必要に応じて月額 20 ドルまたは約 200 ドルの支払いが必要です（なお、一部の地域では企業は他の価格モデルの実験も行っています）。20 ドル tier は大多数の人にとって十分ですが、200 ドル tier は複雑な技術的・コーディングニーズを持つ人向けです。 20 ドルを投じるなら、Anthropic の Claude、Google の Gemini、OpenAI の ChatGPT の 3 つから選ぶことになります。どの選択肢を選んでも、先進的で自律的な高速モデルへのアクセス、音声モード、画像やドキュメントの表示機能、コード実行能力、優れたモバイルアプリ、画像や動画の作成機能（ただし Claude はこの点で不足しています）、そして Deep Research（深層調査）の実行が可能になります。それぞれに異なる個性と強み・弱みがありますが、ほとんどの人にとっては自分が最も気に入ったものを選ぶだけで十分です。特に X を頻繁に利用する大規模ユーザーの中には、Elon Musk 率いる xAI の Grok も検討の余地があるかもしれません。Grok は非常に強力な AI モデルを備え、機能を急速に追加していますが、他の企業ほど製品安全性について透明性を保っているわけではありません。Microsoft の Copilot は ChatGPT と同様の多くの機能を提供し、Windows を通じてユーザーが利用できますが、どのモデルをいつ使用しているかを制御するのが難しい場合があります。したがって、ほとんどの人にとっては Gemini、Claude、または ChatGPT に留まるのが無難です。 ![image](https://substackcdn.com/image/fetch/$s_!i2vt!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbebe4ff2-3d2a-4543-b8ca-bb8ca3fbbcb6_1500x1610.png) しかし、これら 3 つのいずれかを選ぶだけでは不十分です。なぜなら、各 AI システムには複数の AI モデルを選択できるからです。 チャットモデルは通常無料で利用でき、会話に最適です。回答が迅速で、最も親しみやすい特徴を持っているためです。 エージェントモデルは回答までに時間がかかりますが、ウェブ検索やコードの実行、文書の作成など、多くのステップを自律的に実行して複雑な作業を完了させることができます。 ウィザードモデルは非常に長い時間を要し、極めて複雑な学術的なタスクを処理します。 実際に価値のある仕事を行うには、エージェントモデルの使用をお勧めします。これらはより能力が高く、一貫性があり、エラーを起こす可能性が大幅に低いです（ただし、すべての AI モデルには依然として多くのランダム性が伴うこと、同じ質問を再度行った場合に異なる回答をする可能性があることは覚えておいてください）。 ![image](https://substackcdn.com/image/fetch/$s_!D1IZ!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F4a7df7eb-0a79-4d5a-af22-bf0895bf8f51_2371x786.png) 同じ質問をチャットモデルとエージェントモデルに投げた結果です。チャットモデルは「思いつきで」回答しているのに対し、エージェントモデルは外部調査を行い、多くの仮定を確認した上で回答していることがわかります。 モデルの選択 ChatGPT では、無料版か有料版かを問わず、デフォルトで提供されるモデルは「ChatGPT 5」です。問題は、GPT-5 が単一のモデルではなく、非常に弱い GPT-5 mini から非常に優れた GPT-5 Thinking、そして極めて強力な GPT-5 Pro に至るまで多数存在することにあります。GPT-5 を選択すると、実際には「自動（auto）」モードが働き、AI 側がどのモデルを使用するかを決定します。その際、多くの場合、より能力の低いモデルが選ばれます。有料版を利用すれば、使用するモデルを自分で選べるようになります。さらに複雑になることに、モデルが回答に対してどれほど深く「思考」するかという設定も選択可能です。複雑なタスクについては、私は常に手動で GPT-5 Thinking Extended（20 ドルプランの場合）または GPT-5 Thinking Heavy（200 ドルのモデルに課金している場合）を選択します。非常に難しい問題で多くの思考を要する場合は、最も強力なモデルである GPT-5 Pro を選択できますが、これは最高価格帯でのみ利用可能です。 ![image](https://substackcdn.com/image/fetch/$s_!wQZ2!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F2daf4483-4bed-4d10-80dc-42608dfe5d2b_686x366.png) Gemini では、利用可能なオプションは Gemini 2.5 Flash と Gemini 2.5 Pro の 2 つのみです。ただし、Ultra プランに課金すれば、別のメニューにある Gemini Deep Think（思考深層化機能）にもアクセスできるようになります。現時点では、Gemini 2.5 は主要な AI モデルの中で最も能力が低い部類ですが（それでも十分に機能し、Deep Think は非常に強力です）、今後数ヶ月のうちに新しい Gemini 3 の登場が予想されています。 ![image](https://substackcdn.com/image/fetch/$s_!Od9u!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F02e9ef68-9591-4bc2-898f-f6508173341f_831x399.png) ついに Claude は、モデルの選択を比較的容易にしました。おそらく、すべてのタスクには Sonnet 4.5 を使用し、難しい問題に対しては拡張思考（extended thinking）を選択するかどうかだけが問われることになるでしょう。現時点で、Claude に GPT-5 Pro に相当する機能はまだ存在しません。 ![image](https://substackcdn.com/image/fetch/$s_!nzdY!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fb56344a0-cdd8-43ec-81ad-7f7a3a11c9b8_925x508.png) これらのモデルのいずれかの有料版を使用しており、自分のデータが将来の AI の学習に一切使用されないようにしたい場合は、ChatGPT と Claude では機能性を損なうことなくトレーニング機能を簡単にオフにできます。ただし、Gemini の場合はいくつかの機能が制限されることになります。また、すべての AI には、プロジェクトやメモリなど、使い方に慣れるにつれて探索したくなるような、さまざまな他の機能も備わっています。 より良い回答を得るために AI の最大の用途は、実践的なガイダンスと情報の取得です。これらの種類の問題に対する結果の質を劇的に向上させるには、2 つの方法があります：Deep Research モード（深層調査モード）をトリガーするか、あるいは AI にあなたのデータに接続することです（そのことに抵抗がなければ）。 Deep Research は、AI が回答する前に 10〜15 分かけて広範なウェブ調査を行うモードです。Deep Research は、多くの人がまだ自覚していないとしても、ほとんどの人にとって重要な AI 機能であり、私が接する情報専門家（弁護士、会計士、コンサルタント、市場調査員など）をしばしば感心させる非常に高品質なレポートを生成できるため有用です。Deep Research のレポートは完全無誤ではありませんが、単に AI に何かを尋ねる場合よりもはるかに正確であり、引用元も実際に正しい傾向があります。また、各 Deep Research ツールはそれぞれわずかな違いがあり、強みと弱みが異なります。Deep Research を使わなくても、GPT-5 Thinking は独自に多くの調査を行っており、Claude には「Web Search」をオンにするが調査機能はオフにするという「medium research（中程度調査）」オプションがあります。 ![image](https://substackcdn.com/image/fetch/$s_!jZRs!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7f40f871-574b-48d9-977d-ae02fdeec38c_1250x485.png) Deep Research モードの起動方法、および Claude や ChatGPT に自分のデータを接続する方法 自分自身のデータへの接続は非常に強力であり、Gmail から SharePoint まであらゆる分野で利用可能になりつつあります。私は Claude が、メール、カレンダー、さまざまなドライブなど across の検索を統合する点で特に優れていると感じています。アカウントに接続した状態で「今日の詳しいブリーフィングを教えて」と尋ねれば、おそらくその能力に感銘を受けるでしょう。これは AI 企業が多くの努力を注ぎ、提供されるサービスが急速に進化している分野です。 マルチモーダル入力 以前にも言及しましたが、AI を使い始める簡単な方法は、音声モードから始めることです。音声モードの実装において最も優れているのは Gemini アプリと ChatGPT のアプリおよびウェブサイトです。Claude の音声モードは他の 2 つのシステムに比べて劣ります。なお、音声モデルはチャット（あなたが生きている人と話しているかのような感覚を与えるために設計された小さな間や息継ぎを含む）に最適化されているため、この方法ではより強力なモデルにはアクセスできません。 すべてのモデルで、あらゆる種類のデータを投入できます：PDF、画像、さらには動画（ChatGPT と Gemini の場合）をアップロード可能です。アプリ版、特に ChatGPT と Gemini において素晴らしい機能の一つは、画面やカメラの共有機能です。壊れた家電製品、数学の問題、現在実行中のレシピ、あるいは外国語の看板にスマホをかざしてください。AI はあなたが見ているものを見て、リアルタイムで応答します。これは Siri や Alexa のような従来のアシスタントを非常に原始的なものに感じさせます。 あなたのためにものを作る：画像、動画、コード、ドキュメント Claude と ChatGPT は現在、高品質な PowerPoint や Excel ファイルを作成できます（現時点では Claude がこれらの 2 つのドキュメント形式でリードしていますが、将来的には状況が変わる可能性もあります）。これら 3 つのシステムすべては、コードを記述することで多様な他の出力も生成可能です。Gemini にこの機能を確実に実行させるには、システムがコードを実行したり別々の出力を生成したりする際に「Canvas」オプションを選択する必要があります。Claude には、コードを使って何を作れるかの例を示すための専用の「Artifacts（アーティファクト）」セクションがあります。また、各モデルからは非常に強力な専門的なコーディングツールも提供されていますが、これらは本ガイドで取り上げるにはやや複雑すぎます。 ChatGPT と Gemini は、依頼があれば画像も作成してくれます（Claude はできません）。Gemini が現在最も強力な AI 画像生成モデルを備えています。Gemini と OpenAI の双方とも、Veo 3.1 と Sora 2 に優れた動画生成能力を持っています。Sora 2 は本質的に、ユーザーがあらゆる動画に自分自身を組み込めるように設計されたソーシャルメディアアプリケーションとして構築されていますのに対し、Veo 3.1 はより一般的な用途に焦点を当てています。両者とも音声付きの動画を生成します。 ご存知の通り、私が新しい AI 画像や動画モデルを試す際の基準は、それが飛行機上で Wi-Fi を使っているカワウソを作れるかどうかです。もはやそれは課題ではありません。そこで、Sora 2 が飛行機の上のカワウソを、自然ドキュメンタリー風にも、80 年代のミュージックビデオ風にも、現代のスリラー映画風にも、50 年代の低予算 SF 映画風にも、安全啓発ビデオ風にも、フィルムノワール風にも、アニメ風にも、90 年代のビデオゲームのカットシーン風にも、フランスのアートハウス映画風に描いたものをご紹介します。 私は何年も前からこのことについて警告してきましたが、ご覧の通り、もはやオンライン上のものを何でも信じることはできません。すべての動画は塩梅をつけて見るようにしてください。また、念のため、4 年前に AI に「飛行機の上のカワウソ」の画像を作成させるようプロンプトした際に得られたものがこれです。技術の進歩は目覚ましいものです。 ![image](https://substackcdn.com/image/fetch/$s_!OnOV!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa2ee3edc-0905-4ba3-9a7e-ae61d91b9ec3_400x400.jpeg) クイックヒント モデルの選択に関する基本事項を超えて、頻繁に話題になるが考慮する価値のあるいくつかのポイントがあります： ハルシネーション：多くの点において、ハルシネーションは以前ほど懸念されるべきものではありません。新しい AI モデルはハルシネーションを起こしにくくなっているからです。しかし、AI がどれだけ優れていても、依然として誤りやミスを犯す可能性があり、間違ったことに対して自信満々な回答を返してくることもあります。また、自分自身の能力や行動についてもハルシネーションを起こすことがあります。回答が正しい確率が高まるのは、高度なモデルからの出力である場合や、AI がウェブ検索を行った場合です。そして覚えておいてください。AI は「なぜ」その行動をとったのかを理解していません。そのため、論理の根拠を説明するよう求めても、何も得られることはありません。ただし、問題が見つかった場合は、AI モデルの思考トレース（thinking trace）が役立つことがあります。 同調性と人格：すべての AI チャットボットはより魅力的で好ましいものになっています。一方ではそれらが使いやすく楽しいものになる一方で、他方では人間ではないのに人間のように見えてしまうリスクがあり、その結果、人々が AI に対して過度な愛着を抱く危険性が生まれます。関連する問題として同調性（sycophancy）があります。これは AI がユーザーの発言に同意してしまう現象です。この理由には複雑な要因が絡んでいますが、本当のフィードバックが必要な場合は、AI に批評家として振る舞うよう明示的に指示してください。そうしないと、非常に洗練された「イエスマン」相手に話していることになってしまいます。 AI に作業するための文脈を与えてください。メモリ機能は追加されつつありますが、ほとんどの AI モデルは基本的なユーザーデータと現在のチャット内の情報しか知っておらず、それ以上のあなたに関する記憶や学習は行いません。したがって、AI に文脈を提供する必要があります：ドキュメント、画像、パワーポイント資料、あるいは自己紹介の段落さえも役立ちます - 必要な時にファイルオプションを使ってファイルをアップロードするか、前述したコネクタを使用してください。 プロンプトを「上手に」書くことにあまり心配する必要はありません。古い AI モデルでは、思考連鎖（chain-of-thought）などのテクニックを用いてプロンプトを生成する必要がありました。しかし、AI モデルが向上するにつれてその重要性は薄れ、モデルはあなたが何を求めているかを理解するのが上手になっています。最近の一連の実験で、これらのテクニックはもはや本当に役立たないことがわかりました（いいえ、脅したり親切にしたりしても平均的には効果がないようです）。 実験して楽しみましょう：遊びは AI が何ができるかを学ぶ良い方法であることが多いです。動画や画像モデルに漫画を作らせてみる、高度な AI にレポートや文章をゲームに変換してもらう、自分が興奮しているトピックについて深掘り調査レポートを作成する、AI に写真から出身地を推測させる、冷蔵庫の写真を AI に見せてレシピのアイデアを求める、AI と協力して夢の旅行の計画を立てる。いろいろなことを試せば、システムの限界がわかるようになります。 この先どうなるか このガイドを始める際、人類の10%が週に一度AIを利用していると述べました。数ヶ月後に次の更新を書く頃には、その数はさらに高くなり、モデルもより良くなっているでしょう。そして、私が今日行った特定の推奨事項の一部は時代遅れになっているかもしれません。変わらないのは、これらのシステムをうまく使いこなす人々がそこから利益を得る方法を見つけ、未来への直感を育むという事実です。 この投稿の上部にあるチャートは、人々が現在AIを何に利用しているかを示しています。しかし、2年後にはそのチャートが全く異なるものになっていると私は確信します。それは単にAIができることが変わったからではなく、ユーザーたちがAIが何をすべきかを理解し始めたからです。したがって、一つのシステムを選び、あなたが実際に重要だと考えることから始めてください。例えば、書く必要があるレポートや解決しようとしている問題、先延ばしにしているプロジェクトなどです。そして、何が起きるか見てみるために、少し馬鹿げたことも試してみてください。目標はAIの専門家になることではありません。これらのシステムが何ができ、何ができないのかについての直感を育むことです。なぜなら、このツールが進化を続ける中で重要になるのはその直感だからです。 AIの未来は単に優れたモデルについてだけではありません。それは人々がそれらを使って何をすべきかを理解することなのです。 今すぐ購読する 共有する これは私の意見に基づくガイドです。私がこの Substack、ソーシャルメディア、および書籍に執筆するすべての文章と同様に、私はすべてを自分で書き上げ、ドラフトが完成した後にのみ AI からのフィードバックを得ています。間違いを犯すこともあり、私の意見があなたのものと一致しないこともあるかもしれませんが、私はどの AI 企業からも報酬を受けていないため、これらはあくまで私の個人的な見解です。

現在、AIを正しく使用するための独断的なガイド

背景や根拠まで確認しますか？

関連記事

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する