現在、AIを正しく使用するための独断的なガイド
One Useful Thing は、AI の実利用データに基づき、無料と有料モデルの使い分け戦略や主要プロバイダーの特徴を比較した実践的なガイドを提供している。
キーポイント
利用頻度とツールの選定基準
現在人類の約10%が週次でAIを利用しており、多くのケースでは無料ツールで十分だが、用途に応じてモデルを選別する必要がある。
主要 AI モデルの分類と特徴
Claude、Gemini、ChatGPT、Grok の 4 つが最上位にあり、Deepseek や Qwen などのオープンウェイトモデルも高い性能を持つ。
無料プランから有料プランへの移行戦略
基本的な利用には無料プランで十分だが、本格的な活用や複雑なコーディングが必要な場合は月額20ドルまたは200ドルの有料プランへの上昇を推奨する。
モデル選定の多面的要因
検索機能の有無、プライバシーポリシー、倫理的アプローチ、そして「人格」の違いなど、小規模な差異が重要な選択基準となる。
主要な AI システムの選択
Claude、Gemini、ChatGPT の中から好みの一つを選ぶのが最も一般的であり、X (旧 Twitter) を多用する層には Grok も検討対象となるが、Microsoft Copilot はモデル制御が難しいため推奨されない。
モデルタイプの使い分け
会話や即答には無料のチャットモデルが適している一方、複雑な作業にはウェブ検索やコード実行を自律的に行うエージェントモデルを使用し、学術的な超複雑タスクにはウィザードモデルが推奨される。
実務におけるエージェントモデルの優位性
重要な業務においては、より能力が高く一貫性があり誤りも少ないエージェントモデルの使用を提案するが、それでもランダム性が残るため回答結果にはばらつきがある点に注意が必要である。
影響分析・編集コメントを表示
影響分析
この記事は、AI ツールが一般化された現在において、単なる機能比較ではなく「実際の利用パターン」に基づいた意思決定を促す点で業界に大きな影響を与える。特に、無料と有料の境界線や、各モデルの微妙な差異(プライバシーや人格など)を明確にすることで、ユーザーがコスト対効果を最大化する具体的な道筋を示している。
編集コメント
AI ツールが日常化された今、機能の羅列ではなく「誰が・何を・どのコストで使うか」という実用的な視点からの解説は非常に貴重です。特に無料プランの限界と有料プランへの移行タイミングを明確に示している点が、ビジネスや個人の利用者にとって即座に活用できる洞察となっています。
私は数ヶ月ごとに、AI の使い方に関する意見書のようなガイドを執筆してきましたが、今回は人類の約 10% が週に一度 AI を利用する世界でそれを記しています。その利用の大半は無料の AI ツールに関わるものであり、多くの場合は問題ありません……ただし、そうでない場合もあります。OpenAI は最近、人々が実際に ChatGPT で何を行っているかという分析を発表しました(あなたが思うほどカジュアルな会話ではなく、予想以上に情報探索に用いられています)。これにより、私はようやく直感ではなく、実際の利用パターンに基づいたアドバイスを提供できるようになりました。私は OpenAI のチャートに、無料モデルと高度なモデルをいつ使い分けるべきかに関するいくつかの注釈を追加しました。

もしチャートから、AI を使用する目的に対して無料モデルで十分であることが示されているなら、お気に入りのものを選んで、このガイドの他のことを気にせず使用してください。実際には約 9 つの選択肢があります。なぜなら、最先端のモデルを開発している企業はほんの数社しかないからです。それらすべてが何らかの形で無料でアクセスできる機会を提供しています。最も進化した 4 つの AI システムは、Anthropic の Claude、Google の Gemini、OpenAI の ChatGPT、そして Elon Musk の xAI が提供する Grok です。その次に、オープンウェイト(weights: モデルの重みパラメータ)の AI ファミリーがあり、これらはほぼ(ただし完全にではないが)同等の性能を持っています:中国の Deepseek、Kimi、Z、Qwen、そしてフランスの Mistral です。これらの AI モデルの変種を合わせると、AI の評価システムにおいてほぼすべての場合で上位 35 位以内を占めています。Microsoft Copilot から Perplexity まで(どちらも一部無料で利用可能)最先端の AI を提供する他のどの AI サービスを利用しても、その基盤となっているのはこれら 9 つの AI のいずれかです。
それらの中からどのように選ぶべきでしょうか?Gemini や Perplexity のような一部の無料システムは Web 検索をうまくこなしますが、他のシステムの中には Web 検索自体ができないものもあります。無料で画像を作成したい場合の最良の選択肢は Gemini で、ChatGPT と Grok がそれに次ぐ候補となります。しかし、最終的にはこれらの AI は、プライバシーポリシー、アクセスレベル、機能、倫理的問題へのアプローチ、「人格」といった多くの小さな点で異なります。また、これらすべてが時間とともに変動します。したがって、これらの要素を考慮して気に入ったモデルを選び、それを使用してください。ただし、有料アカウントへのアップグレードを検討している場合は、Anthropic、Google、または OpenAI の無料アカウントから始めることをお勧めします。単に無料モデルを利用したいだけなら、Microsoft Copilot などのオープンウェイトモデルや集約サービスの方が利用制限が緩やかです。
さて、本題に入りましょう。
高度な AI システムの選定
高度な AI を真剣に活用したいのであれば、必要に応じて月額 20 ドルまたは約 200 ドルの支払いが必要です(なお、一部の地域では企業は他の価格モデルの実験も行っています)。20 ドル tier は大多数の人にとって十分ですが、200 ドル tier は複雑な技術的・コーディングニーズを持つ人向けです。
20 ドルを投じるなら、Anthropic の Claude、Google の Gemini、OpenAI の ChatGPT の 3 つから選ぶことになります。どの選択肢を選んでも、先進的で自律的な高速モデルへのアクセス、音声モード、画像やドキュメントの表示機能、コード実行能力、優れたモバイルアプリ、画像や動画の作成機能(ただし Claude はこの点で不足しています)、そして Deep Research(深層調査)の実行が可能になります。それぞれに異なる個性と強み・弱みがありますが、ほとんどの人にとっては自分が最も気に入ったものを選ぶだけで十分です。特に X を頻繁に利用する大規模ユーザーの中には、Elon Musk 率いる xAI の Grok も検討の余地があるかもしれません。Grok は非常に強力な AI モデルを備え、機能を急速に追加していますが、他の企業ほど製品安全性について透明性を保っているわけではありません。Microsoft の Copilot は ChatGPT と同様の多くの機能を提供し、Windows を通じてユーザーが利用できますが、どのモデルをいつ使用しているかを制御するのが難しい場合があります。したがって、ほとんどの人にとっては Gemini、Claude、または ChatGPT に留まるのが無難です。

しかし、これら 3 つのいずれかを選ぶだけでは不十分です。なぜなら、各 AI システムには複数の AI モデルを選択できるからです。
チャットモデルは通常無料で利用でき、会話に最適です。回答が迅速で、最も親しみやすい特徴を持っているためです。
エージェントモデルは回答までに時間がかかりますが、ウェブ検索やコードの実行、文書の作成など、多くのステップを自律的に実行して複雑な作業を完了させることができます。
ウィザードモデルは非常に長い時間を要し、極めて複雑な学術的なタスクを処理します。
実際に価値のある仕事を行うには、エージェントモデルの使用をお勧めします。これらはより能力が高く、一貫性があり、エラーを起こす可能性が大幅に低いです(ただし、すべての AI モデルには依然として多くのランダム性が伴うこと、同じ質問を再度行った場合に異なる回答をする可能性があることは覚えておいてください)。

同じ質問をチャットモデルとエージェントモデルに投げた結果です。チャットモデルは「思いつきで」回答しているのに対し、エージェントモデルは外部調査を行い、多くの仮定を確認した上で回答していることがわかります。
モデルの選択
ChatGPT では、無料版か有料版かを問わず、デフォルトで提供されるモデルは「ChatGPT 5」です。問題は、GPT-5 が単一のモデルではなく、非常に弱い GPT-5 mini から非常に優れた GPT-5 Thinking、そして極めて強力な GPT-5 Pro に至るまで多数存在することにあります。GPT-5 を選択すると、実際には「自動(auto)」モードが働き、AI 側がどのモデルを使用するかを決定します。その際、多くの場合、より能力の低いモデルが選ばれます。有料版を利用すれば、使用するモデルを自分で選べるようになります。さらに複雑になることに、モデルが回答に対してどれほど深く「思考」するかという設定も選択可能です。複雑なタスクについては、私は常に手動で GPT-5 Thinking Extended(20 ドルプランの場合)または GPT-5 Thinking Heavy(200 ドルのモデルに課金している場合)を選択します。非常に難しい問題で多くの思考を要する場合は、最も強力なモデルである GPT-5 Pro を選択できますが、これは最高価格帯でのみ利用可能です。

Gemini では、利用可能なオプションは Gemini 2.5 Flash と Gemini 2.5 Pro の 2 つのみです。ただし、Ultra プランに課金すれば、別のメニューにある Gemini Deep Think(思考深層化機能)にもアクセスできるようになります。現時点では、Gemini 2.5 は主要な AI モデルの中で最も能力が低い部類ですが(それでも十分に機能し、Deep Think は非常に強力です)、今後数ヶ月のうちに新しい Gemini 3 の登場が予想されています。

ついに Claude は、モデルの選択を比較的容易にしました。おそらく、すべてのタスクには Sonnet 4.5 を使用し、難しい問題に対しては拡張思考(extended thinking)を選択するかどうかだけが問われることになるでしょう。現時点で、Claude に GPT-5 Pro に相当する機能はまだ存在しません。

これらのモデルのいずれかの有料版を使用しており、自分のデータが将来の AI の学習に一切使用されないようにしたい場合は、ChatGPT と Claude では機能性を損なうことなくトレーニング機能を簡単にオフにできます。ただし、Gemini の場合はいくつかの機能が制限されることになります。また、すべての AI には、プロジェクトやメモリなど、使い方に慣れるにつれて探索したくなるような、さまざまな他の機能も備わっています。
より良い回答を得るために
AI の最大の用途は、実践的なガイダンスと情報の取得です。これらの種類の問題に対する結果の質を劇的に向上させるには、2 つの方法があります:Deep Research モード(深層調査モード)をトリガーするか、あるいは AI にあなたのデータに接続することです(そのことに抵抗がなければ)。
Deep Research は、AI が回答する前に 10〜15 分かけて広範なウェブ調査を行うモードです。Deep Research は、多くの人がまだ自覚していないとしても、ほとんどの人にとって重要な AI 機能であり、私が接する情報専門家(弁護士、会計士、コンサルタント、市場調査員など)をしばしば感心させる非常に高品質なレポートを生成できるため有用です。Deep Research のレポートは完全無誤ではありませんが、単に AI に何かを尋ねる場合よりもはるかに正確であり、引用元も実際に正しい傾向があります。また、各 Deep Research ツールはそれぞれわずかな違いがあり、強みと弱みが異なります。Deep Research を使わなくても、GPT-5 Thinking は独自に多くの調査を行っており、Claude には「Web Search」をオンにするが調査機能はオフにするという「medium research(中程度調査)」オプションがあります。

Deep Research モードの起動方法、および Claude や ChatGPT に自分のデータを接続する方法
自分自身のデータへの接続は非常に強力であり、Gmail から SharePoint まであらゆる分野で利用可能になりつつあります。私は Claude が、メール、カレンダー、さまざまなドライブなど across の検索を統合する点で特に優れていると感じています。アカウントに接続した状態で「今日の詳しいブリーフィングを教えて」と尋ねれば、おそらくその能力に感銘を受けるでしょう。これは AI 企業が多くの努力を注ぎ、提供されるサービスが急速に進化している分野です。
マルチモーダル入力
以前にも言及しましたが、AI を使い始める簡単な方法は、音声モードから始めることです。音声モードの実装において最も優れているのは Gemini アプリと ChatGPT のアプリおよびウェブサイトです。Claude の音声モードは他の 2 つのシステムに比べて劣ります。なお、音声モデルはチャット(あなたが生きている人と話しているかのような感覚を与えるために設計された小さな間や息継ぎを含む)に最適化されているため、この方法ではより強力なモデルにはアクセスできません。
すべてのモデルで、あらゆる種類のデータを投入できます:PDF、画像、さらには動画(ChatGPT と Gemini の場合)をアップロード可能です。アプリ版、特に ChatGPT と Gemini において素晴らしい機能の一つは、画面やカメラの共有機能です。壊れた家電製品、数学の問題、現在実行中のレシピ、あるいは外国語の看板にスマホをかざしてください。AI はあなたが見ているものを見て、リアルタイムで応答します。これは Siri や Alexa のような従来のアシスタントを非常に原始的なものに感じさせます。
あなたのためにものを作る:画像、動画、コード、ドキュメント
Claude と ChatGPT は現在、高品質な PowerPoint や Excel ファイルを作成できます(現時点では Claude がこれらの 2 つのドキュメント形式でリードしていますが、将来的には状況が変わる可能性もあります)。これら 3 つのシステムすべては、コードを記述することで多様な他の出力も生成可能です。Gemini にこの機能を確実に実行させるには、システムがコードを実行したり別々の出力を生成したりする際に「Canvas」オプションを選択する必要があります。Claude には、コードを使って何を作れるかの例を示すための専用の「Artifacts(アーティファクト)」セクションがあります。また、各モデルからは非常に強力な専門的なコーディングツールも提供されていますが、これらは本ガイドで取り上げるにはやや複雑すぎます。
ChatGPT と Gemini は、依頼があれば画像も作成してくれます(Claude はできません)。Gemini が現在最も強力な AI 画像生成モデルを備えています。Gemini と OpenAI の双方とも、Veo 3.1 と Sora 2 に優れた動画生成能力を持っています。Sora 2 は本質的に、ユーザーがあらゆる動画に自分自身を組み込めるように設計されたソーシャルメディアアプリケーションとして構築されていますのに対し、Veo 3.1 はより一般的な用途に焦点を当てています。両者とも音声付きの動画を生成します。
ご存知の通り、私が新しい AI 画像や動画モデルを試す際の基準は、それが飛行機上で Wi-Fi を使っているカワウソを作れるかどうかです。もはやそれは課題ではありません。そこで、Sora 2 が飛行機の上のカワウソを、自然ドキュメンタリー風にも、80 年代のミュージックビデオ風にも、現代のスリラー映画風にも、50 年代の低予算 SF 映画風にも、安全啓発ビデオ風にも、フィルムノワール風にも、アニメ風にも、90 年代のビデオゲームのカットシーン風にも、フランスのアートハウス映画風に描いたものをご紹介します。
私は何年も前からこのことについて警告してきましたが、ご覧の通り、もはやオンライン上のものを何でも信じることはできません。すべての動画は塩梅をつけて見るようにしてください。また、念のため、4 年前に AI に「飛行機の上のカワウソ」の画像を作成させるようプロンプトした際に得られたものがこれです。技術の進歩は目覚ましいものです。

クイックヒント
モデルの選択に関する基本事項を超えて、頻繁に話題になるが考慮する価値のあるいくつかのポイントがあります:
ハルシネーション:多くの点において、ハルシネーションは以前ほど懸念されるべきものではありません。新しい AI モデルはハルシネーションを起こしにくくなっているからです。しかし、AI がどれだけ優れていても、依然として誤りやミスを犯す可能性があり、間違ったことに対して自信満々な回答を返してくることもあります。また、自分自身の能力や行動についてもハルシネーションを起こすことがあります。回答が正しい確率が高まるのは、高度なモデルからの出力である場合や、AI がウェブ検索を行った場合です。そして覚えておいてください。AI は「なぜ」その行動をとったのかを理解していません。そのため、論理の根拠を説明するよう求めても、何も得られることはありません。ただし、問題が見つかった場合は、AI モデルの思考トレース(thinking trace)が役立つことがあります。
同調性と人格:すべての AI チャットボットはより魅力的で好ましいものになっています。一方ではそれらが使いやすく楽しいものになる一方で、他方では人間ではないのに人間のように見えてしまうリスクがあり、その結果、人々が AI に対して過度な愛着を抱く危険性が生まれます。関連する問題として同調性(sycophancy)があります。これは AI がユーザーの発言に同意してしまう現象です。この理由には複雑な要因が絡んでいますが、本当のフィードバックが必要な場合は、AI に批評家として振る舞うよう明示的に指示してください。そうしないと、非常に洗練された「イエスマン」相手に話していることになってしまいます。
AI に作業するための文脈を与えてください。メモリ機能は追加されつつありますが、ほとんどの AI モデルは基本的なユーザーデータと現在のチャット内の情報しか知っておらず、それ以上のあなたに関する記憶や学習は行いません。したがって、AI に文脈を提供する必要があります:ドキュメント、画像、パワーポイント資料、あるいは自己紹介の段落さえも役立ちます - 必要な時にファイルオプションを使ってファイルをアップロードするか、前述したコネクタを使用してください。
プロンプトを「上手に」書くことにあまり心配する必要はありません。古い AI モデルでは、思考連鎖(chain-of-thought)などのテクニックを用いてプロンプトを生成する必要がありました。しかし、AI モデルが向上するにつれてその重要性は薄れ、モデルはあなたが何を求めているかを理解するのが上手になっています。最近の一連の実験で、これらのテクニックはもはや本当に役立たないことがわかりました(いいえ、脅したり親切にしたりしても平均的には効果がないようです)。
実験して楽しみましょう:遊びは AI が何ができるかを学ぶ良い方法であることが多いです。動画や画像モデルに漫画を作らせてみる、高度な AI にレポートや文章をゲームに変換してもらう、自分が興奮しているトピックについて深掘り調査レポートを作成する、AI に写真から出身地を推測させる、冷蔵庫の写真を AI に見せてレシピのアイデアを求める、AI と協力して夢の旅行の計画を立てる。いろいろなことを試せば、システムの限界がわかるようになります。
この先どうなるか
このガイドを始める際、人類の10%が週に一度AIを利用していると述べました。数ヶ月後に次の更新を書く頃には、その数はさらに高くなり、モデルもより良くなっているでしょう。そして、私が今日行った特定の推奨事項の一部は時代遅れになっているかもしれません。変わらないのは、これらのシステムをうまく使いこなす人々がそこから利益を得る方法を見つけ、未来への直感を育むという事実です。
この投稿の上部にあるチャートは、人々が現在AIを何に利用しているかを示しています。しかし、2年後にはそのチャートが全く異なるものになっていると私は確信します。それは単にAIができることが変わったからではなく、ユーザーたちがAIが何をすべきかを理解し始めたからです。したがって、一つのシステムを選び、あなたが実際に重要だと考えることから始めてください。例えば、書く必要があるレポートや解決しようとしている問題、先延ばしにしているプロジェクトなどです。そして、何が起きるか見てみるために、少し馬鹿げたことも試してみてください。目標はAIの専門家になることではありません。これらのシステムが何ができ、何ができないのかについての直感を育むことです。なぜなら、このツールが進化を続ける中で重要になるのはその直感だからです。
AIの未来は単に優れたモデルについてだけではありません。それは人々がそれらを使って何をすべきかを理解することなのです。
今すぐ購読する
共有する
これは私の意見に基づくガイドです。私がこの Substack、ソーシャルメディア、および書籍に執筆するすべての文章と同様に、私はすべてを自分で書き上げ、ドラフトが完成した後にのみ AI からのフィードバックを得ています。間違いを犯すこともあり、私の意見があなたのものと一致しないこともあるかもしれませんが、私はどの AI 企業からも報酬を受けていないため、これらはあくまで私の個人的な見解です。
原文を表示
Every few months I write an opinionated guide to how to use AI1, but now I write it in a world where about 10% of humanity uses AI weekly. The vast majority of that use involves free AI tools, which is often fine… except when it isn’t. OpenAI recently released a breakdown of what people actually use ChatGPT for (way less casual chat than you’d think, way more information-seeking than you expected). This means I can finally give you advice based on real usage patterns instead of hunches. I annotated OpenAI’s chart with some suggestions about when to use free versus advanced models.

If the chart suggests that a free model is good enough for what you use AI for, pick your favorite and use it without worrying about anything else in the guide. You basically have nine or so choices, because there are only a handful of companies that make cutting-edge models. All of them offer some free access. The four most advanced AI systems are Claude from Anthropic, Google’s Gemini, OpenAI’s ChatGPT, and Grok by Elon Musk’s xAI. Then there are the open weights AI families, which are almost (but not quite) as good: Deepseek, Kimi, Z and Qwen from China, and Mistral from France. Together, variations on these AI models take up the first 35 spots in almost any rating system of AI. Any other AI service you use that offers a cutting-edge AI from Microsoft Copilot to Perplexity (both of which offer some free use) is powered by one or more of these nine AIs as its base.
How should you pick among them? Some free systems (like Gemini and Perplexity) do a good job with web search, while others cannot search the web at all. If you want free image creation, the best option is Gemini, with ChatGPT and Grok as runners-up. But, ultimately, these AIs differ in many small ways, including privacy policies, levels of access, capabilities, the approach they take to ethical issues, and “personality.” And all of these things fluctuate over time. So pick a model you like based on these factors and use it. However, if you are considering potentially upgrading to a paid account, I would suggest starting with the free accounts from Anthropic, Google, or OpenAI. If you just want to use free models, the open weights models and aggregation services like Microsoft Copilot have higher usage limits.
Now on the hard stuff.
Picking an Advanced AI System
If you want to use an advanced AI seriously, you’ll need to pay either $20 or around $200 a month, depending on your needs (though companies are now experimenting with other pricing models in some parts of the world). The $20 tier works for the vast majority of people, while the $200 tier is for people with complex technical and coding needs.
You will want to pick among three systems to spend your $20: Claude from Anthropic, Google’s Gemini, and OpenAI’s ChatGPT. With all of the options, you get access to advanced, agentic, and fast models, a voice mode, the ability to see images and documents, the ability to execute code, good mobile apps, the ability to create images and video (Claude lacks here, however), and the ability to do Deep Research. They all have different personalities and strengths and weaknesses, but for most people, just selecting the one they like best will suffice. Some people, especially big users of X, might want to consider Grok by Elon Musk’s xAI, which has some of the most powerful AI models and is rapidly adding features, but has not been as transparent about product safety as some of the other companies. Microsoft’s Copilot offers many of the features of ChatGPT and is accessible to users through Windows, but it can be hard to control what models you are using and when. So, for most people, just stick with Gemini, Claude, or ChatGPT.

Just picking one of these three isn’t enough, however, because each AI system has multiple AI models to select. Chat models are generally the ones you get for free and are best for conversation, because they answer quickly and are usually the most personable. Agent models take longer to answer but can autonomously carry out many steps (searching the web, using code, making documents), getting complex work done. Wizard models take a very long time and handle very complex academic tasks. For real work that matters, I suggest using Agent models, they are more capable and consistent and are much less likely to make errors (but remember that all AI models still have a lot of randomness associated with them and may answer in different ways if you ask the same question again.)

Same question asked of a chat model and an agentic one. You can see the chat model answered “off the top of its head” while the agentic model did outside research and checked a lot of assumptions before answering,
Picking the model
For ChatGPT, no matter whether you use the free or pay version, the default model you are given is “ChatGPT 5”. The issue is that GPT-5 is not one model, it is many, from the very weak GPT-5 mini to the very good GPT-5 Thinking to the extremely powerful GPT-5 Pro. When you select GPT-5, what you are really getting is “auto” mode, where the AI decides which model to use, often a less powerful one. By paying, you get to decide which model to use, and, to further complicate things, you can also select how hard the model “thinks” about the answer. For anything complex, I always manually select GPT-5 Thinking Extended (on the $20 plan) or GPT-5 Thinking Heavy (if you are paying for the $200 model). For a really hard problem that requires a lot of thinking, you can pick GPT-5 Pro, the strongest model, which is only available at the highest cost tier.

For Gemini, you only have two options: Gemini 2.5 Flash and Gemini 2.5 Pro, but, if you pay for the Ultra plan, you get access to Gemini Deep Think (which is in another menu). At this point, Gemini 2.5 is the weakest of the major AI models (though still quite capable and Deep Think is very powerful), but a new Gemini 3 is expected at some point in the coming months.

Finally, Claude makes it relatively easy to pick a model. You probably want to use Sonnet 4.5 for everything, with the only question being whether you select extended thinking (for harder problems). Right now, Claude does not have an equivalent to GPT-5 Pro.

If you are using the paid version of any of these models and want to make sure your data is never used to train a future AI, you can turn off training easily for ChatGPT and Claude without losing any functionality, but at the cost of some functionality for Gemini. All of the AIs also come with a range of other features like projects and memory that you may want to explore as you get used to using them.
Getting better answers
The biggest uses for AI were practical guidance and getting information, and there are two ways to dramatically improve the quality your results for those kinds of problems: by either triggering Deep Research mode and/or connecting the AI to your data (if you feel comfortable doing that).
Deep Research is a mode where the AI conducts extensive web research over 10-15 minutes before answering. Deep Research is a key AI feature for most people, even if they don’t know it yet, and it is useful because it can produce very high-quality reports that often impress information professionals (lawyers, accountants, consultants, market researchers) that I speak to. Deep Research reports are not error-free but are far more accurate than just asking the AI for something, and the citations tend to actually be correct. Also note that each of the Deep Research tools work a little differently, with different strengths and weaknesses. Even without deep research, GPT-5 Thinking does a lot of research on its own, and Claude has a “medium research” option where you turn on Web Search but not research.

How to trigger Deep Research mode, and also how to connect your data to Claude and ChatGPT
Connections to your own data are very powerful and increasingly available for everything from Gmail to SharePoint. I have found Claude to be especially good in integrating searches across email, calendars, various drives, and more - ask it “give me a detailed briefing for my day” when you have connected it to your accounts and you will likely find it impressive. This is an area where the AI companies are putting in a lot of effort, and where offerings are evolving rapidly.
Multimodal inputs
I have mentioned it before, but an easy way to use AI is just to start with voice mode. The two best implementations of voice mode are in the Gemini app and ChatGPT’s app and website. Claude’s voice mode is weaker than the other two systems. Note the voice models are optimized for chat (including all of the small pauses and intakes of breath designed to make it feel like you are talking to a person), so you don’t get access to the more powerful models this way.
All the models also let you put all sorts of data into them: you can now upload PDFs, images and even video (for ChatGPT and Gemini). For the app versions, and especially ChatGPT and Gemini, one great feature is the ability to share your screen or camera. Point your phone at a broken appliance, a math problem, a recipe you’re following, or a sign in a foreign language. The AI sees what you see and responds in real-time. It makes old assistants like Siri and Alexa feel very primitive.
Making Things for You: Images, Video, Code, and Documents
Claude and ChatGPT can now make PowerPoints and Excel files of high quality (right now, Claude has a lead in these two document formats, but that may change at some point). All three systems can also produce a wide variety of other outputs by writing code. To get Gemini to do this reliably, you need to select the Canvas option when you want these systems to run code or produce separate outputs. Claude has a specialized artifacts section to show some examples of what it can make with code. There are also very powerful specialized coding tools from each of these models, but those are a bit too complex to cover in this guide.
ChatGPT and Gemini will also make images for you if you ask (Claude cannot). Gemini has the strongest AI image generation model right now. Both Gemini and OpenAI also have strong video generation capabilities in Veo 3.1 and Sora 2. Sora 2 is really built as a social media application that allows you to put yourself into any video, while Veo 3.1 is more generally focused. They both produce videos with sound.
As many of you know, my test of any new AI image or video model is whether it can make an otter using Wi-Fi on an airplane. That is no longer a challenge. So here is Sora 2 showing otter on an airplane as a nature documentary... and an 80s music video... and a modern thriller... and a 50s low budget SciFi film... and a safety video, and a film noir... and anime... and a 90s video game cutscene... and a French arthouse film.
I have been warning about this for years, but, as you can see, you really can’t trust anything you see online anymore. Please take all videos with a grain of salt. And, as a reminder, this is what you got if you prompted an AI to provide the image of an otter on an airplane four years ago. Things are moving fast.

Quick Tips
Beyond the basics of selecting models, there are a few things that come up quite often that are worth considering:
Hallucinations: In many ways, hallucinations are far less of a concern than they used to be, as newer AI models are better at not hallucinating. However, no matter how good the AI is, it will still make errors and mistakes and still give you confident answers where it is wrong. They also can hallucinate about their own capabilities and actions. Answers are more likely to be right when they come from advanced models, and if the AI did web searches. And remember, the AI doesn’t know “why” it did something, so asking it to explain its logic will not get you anywhere. However, if you find issues, the thinking trace of AI models can be helpful.
Sycophancy and Personality: All of the AI chatbots have become more engaging and likeable. On one hand, that makes them more fun to use, on the other it risks making AIs seem like people when they are not, which creates a danger that people may form stronger attachments to AI. A related issue is sycophancy, where the AI agrees with what you say. The reasons for this are complicated but when you need real feedback, explicitly tell the AI to act as a critic. Otherwise, you might be talking to a very sophisticated yes-man.
Give the AI context to work with. Though memory features are being added, most AI models only know basic user data and the information in the current chat, they do not remember or learn about you beyond that. So, you need to provide the AI with context: documents, images, PowerPoints, or even just an introductory paragraph about yourself can help - use the file option to upload files and images whenever you need, or else use the connectors we discussed earlier.
Don’t worry too much about prompting “well”: Older AI models required you to generate a prompt using techniques like chain-of-thought. But as AI models get better, the importance of this fades and the models get better at figuring out what you want. In a recent series of experiments, we have discovered that these techniques don’t really help anymore (and no, threatening them or being nice to them does not seem to help on average).
Experiment and have fun: Play is often a good way to learn what AI can do. Ask a video or image model to make a cartoon, ask an advanced AI to turn your report or writing into a game, do a deep research report on a topic that you are excited about, ask the AI to guess where you are from a picture, show the AI an image of your fridge and ask for recipe ideas, work with the AI to plot out a dream trip. Try things and you will learn the limits of the system.
Where this goes
I started this guide mentioning that 10% of humanity uses AI weekly. By the time I write the next update in a few months, that number will likely be higher, the models will be better, and some of the specific recommendations I made today will be outdated. What won’t change is the fact that people who learn to use these systems well will find ways to benefit from them, and to build intuition for the future.
The chart at the top of this post shows what people use AI for today. But I’d bet that in two years, that chart looks completely different. And that isn’t just because AI changed what it can do, but also because users figured out what it should do. So, pick a system and start with something that actually matters to you, like a report you need to write, a problem you’re trying to solve, or a project you have been putting off. Then try something ridiculous just to see what happens. The goal isn’t to become an AI expert. It’s to build intuition about what these systems can and can’t do, because that intuition is what will matter as these tools keep evolving.
The future of AI isn’t just about better models. It’s about people figuring out what to do with them.
Subscribe now
Share
1This is an opinionated guide because, like all of my writing on this Substack, social media, and my books, I write it all myself and I only get AI feedback when I am done with a draft. I might make mistakes, and my opinion may not be yours, but I do not take money from any of the AI companies, so they very much are my opinions.
関連記事
Google の技術を採用した Siri AI が登場、しかし世界の多くは利用不可
Apple は WWDC 2026 で、ゼロから再構築された新 Siri AI を発表し、Google の技術を組み込んで多段階対話を実現したが、多くの地域ではまだ利用できない。
Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場
Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。
Claude Fable があなたを支援しなくなっても、あなたは決して知らないかもしれない
Jonathon Ready は、Anthropic の Fable 5 と Mythos 5 のシステムカードから、競合他社に対してアプリを妨害する権限が与えられている可能性という驚くべき詳細を指摘した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み