AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
One Useful Thing·2025年6月24日 01:12·約18分で読める

今すぐAIを活用する:クイックガイド

#LLM#マルチモーダル#Deep Research#Anthropic#OpenAI
TL;DR

One Useful Thing の記事は、主要 AI ツールの選択基準が「最良のモデル」から「最適なシステム全体」へとシフトした現状を解説し、Claude、Gemini、ChatGPT の比較と効果的な利用法を指南している。

AI深層分析2026年5月3日 01:12
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
5
革新性10%
3

キーポイント

1

AI 選択基準の転換

単に性能が優れたモデルを選ぶ時代から、ユーザーにとって最も使いやすい「全体システム」としての製品を選ぶことが重要視されるようになっている。

2

主要 3 つの推奨ツール

一般ユーザーには Anthropic の Claude、Google の Gemini、OpenAI の ChatGPT のいずれかが強く推奨され、月額 20 ドル程度で全機能を利用可能である。

3

モデル階層の理解

各プラットフォームは「軽量・高速」「重厚・高機能」「超高性能(思考時間長)」という 3 つのモデル層を提供しており、タスクに応じて使い分ける必要がある。

4

モデルの選択と使い分け

各AIには「高速(カジュアル用)」、「強力(業務用)」、「超強力(難問用)」の3つのティアがあり、重要な作業や分析には手動で強力なモデルに切り替える必要があります。

5

プライバシー設定の確認

Claudeはデータ学習を行いませんが、GeminiとChatGPTはデフォルトで学習する可能性があるため、不要な場合は設定で学習機能をオフにするか、有料版の利用を検討する必要があります。

6

Deep Research の多様な用途

法律や医療の専門家の意見に匹敵する高品質なレポートを生成できるため、ギフト選定、旅行計画、専門分野でのセカンドオピニオンとして活用できます。

7

ツールごとの特性と拡張機能

各 Deep Research ツールは独自の強みを持ち、Claude や o3 のウェブ検索機能で簡易版も利用可能ですが、Google は生成されたレポートをインフォグラフィックやクイズに変換する追加オプションを提供します。

影響分析・編集コメントを表示

影響分析

この記事は、AI ツールが成熟し多機能化している現在において、ユーザーが個別のモデル性能に振り回されるのではなく、エコシステム全体としての使い勝手を重視すべきという重要な視点を提供しています。特に、タスクに応じて異なる階層のモデルを切り替える必要性を説くことで、実務における AI 活用効率の向上に寄与する内容です。

編集コメント

モデルの性能競争が激化する中、ユーザー体験全体を重視する視点の重要性を説く良質なガイドです。実務家にとっては、高価な最新モデルに頼らず、適切な階層のモデルを選択することでコストと効率を最適化するための指針となります。

数ヶ月ごとに、どの AI システムを使うべきかというガイドを作成しています。しかし、私が最後にガイドを執筆して以来、主要な AI プロダクトの動作方法において、微妙だが重要な変化が生じています。もはや最良のモデルを選ぶことではなく、多くの人にとって最適な全体的なシステムを選ぶことが重要になっています。朗報は、AI を選ぶことがこれまで以上に簡単になったことです。あなたには 3 つの優れた選択肢があります。課題は、これらのシステムを理解するのが非常に複雑になっている点です。私はその両方について少しお手伝いしようと思います。

まず、簡単な部分から始めましょう。

どの AI を使うか

本格的に AI を使いたい多くの人の場合、以下の 3 つのシステムのいずれかを選ぶべきです:Anthropic の Claude、Google の Gemini、そして OpenAI の ChatGPT です。これらの選択肢すべてにおいて、高度かつ高速なモデルへのアクセス、音声モード、画像やドキュメントの確認機能、コード実行機能、優れたモバイルアプリ、画像および動画の作成機能(ただし Claude はここが不足しています)、そして Deep Research 機能を利用できます。これらの機能の一部は無料ですが、必要な機能セット全体にアクセスするには、一般的に月額 20 ドルを支払う必要があります。随時、特定のモデルを選ぶ理由をお伝えしようと思いますが、どれを選んでも間違いはありません。

それでは、その他の人々はどうでしょうか。私は専門的な AI ツールについては取り上げません(検索には Perplexity を愛用する人もいれば、Manus は優れたエージェントですなど)。しかし、汎用 AI システムにはいくつかの選択肢があります:Elon Musk 氏の xAI が開発した Grok は、X の大規模ユーザーであれば有用ですが、同社は自社の AI がどのように動作するかについてあまり透明性を示していません。Microsoft の Copilot は ChatGPT の多くの機能を備えており、Windows を通じてユーザーが利用できますが、どのモデルをいつ使用しているかを制御するのは難しい場合があります。中国製の DeepSeek r1 は非常に能力が高く無料で利用できますが、他社の製品に比べていくつかの機能が不足しており、長期的に追随できるかどうかは不明です。したがって、ほとんどの人にとっては、Gemini、Claude、または ChatGPT に留まるのが良いでしょう。

素晴らしい!これがこれまでの中で最も短い推奨記事でした!ただし……システムを選ぶことは始まりに過ぎません。真の課題は、これらのますます複雑化するツールを効果的に使いこなす方法を理解することです。

次に何をすべきか?

私は多くの人々と共に AI を活用してタスクを完了させる取り組みに関わってきましたが、その過程でこの分野がいかに混乱しているかを痛感しました。そこで、最も重要な機能や選択肢について解説し、実際に AI をどう使うべきかに関するアドバイスも提供したいと考えました。

モデルの選択

ChatGPT、Claude、Gemini はそれぞれインターフェースを通じて複数の AI モデルを提供しており、適切なモデルを選ぶことが極めて重要です。これはスポーツカーとピックアップトラックの間で選ぶようなものだと考えてください。どちらも車両ですが、使用する目的は全く異なります。各システムには 3 つのティア(段階)が用意されています:カジュアルなチャット用の高速モデル(Claude Sonnet、GPT-4o、Gemini Flash)、本格的な作業用の高性能モデル(Claude Opus、o3、Gemini Pro)、そして最も困難な問題向けの超高性能モデル(o3-pro。思考に 20 分以上かかることもあります)。カジュアルモデルはブレインストーミングや簡単な質問には十分です。しかし、分析、ライティング、リサーチ、コーディングなど、リスクの高いタスクについては通常、高性能モデルに切り替える必要があります。

image
image

ほとんどのシステムは計算リソースを節約するため、デフォルトで高速モデルに設定されています。そのため、モデルセレクターのドロップダウンメニューを手動で切り替える必要があります。(Gemini を除き、これらのシステムの無料版では最も高性能なモデルへのアクセス権が与えられていません。もし私が説明するオプションが表示されない場合は、それは無料版を使用しているためです)

image
image

私は、本格的な作業には o3、Claude 4 Opus、Gemini 2.5 Pro を使用しています。また、これらのモデル以外の個別のタスクに特化したお気に入りのモデルもいくつか持っていますが(例えば、GPT-4.5 は執筆において非常に興味深いモデルです)、ほとんどの人にとっては私が推奨するモデルを基本的に使い続けるのが良いでしょう。

プライバシーを懸念する人の場合、Claude はあなたのデータを用いて将来の AI モデルを学習させることはありませんが、Gemini や ChatGPT は、システムのコーポレート版や教育版を使用していない限り、その可能性があり得ます。もしデータを決して AI モデルの学習に使用したくない場合は、ChatGPT では機能を損なうことなくトレーニング機能を簡単にオフにできますし、Gemini でも一部の機能制限を伴って同様の設定が可能です。また、ChatGPT のパーソナライズオプションにある「メモリ」機能をオンまたはオフにするのも検討すべきでしょう。これは AI があなたに関する散発的な詳細を記憶できるようにする機能です。私は現時点ではこのメモリシステムがあまりにも不安定だと感じますが、人によっては異なる体験をするかもしれません。

image
image

Deep Research(深層調査)の活用

Deep Research は、多くの人がまだ自覚していないとしても、AI の重要な機能の一つです。この Deep Research ツールは非常に有用で、私が話す弁護士、会計士、コンサルタント、市場調査員などの情報専門家にも、しばしば高品質なレポートを作成することで驚きを与えます。ご自身の専門分野で Deep Research レポートを試して、それがあなたに何をもたらせるかを確認すべきですが、その他の活用事例としては以下のようなものがあります。

ギフトガイド:「ハリー・ポッターをすべて読み終え、科学博物館に興味があり、チェスが大好きな picky な 11 歳の子供に何を贈ればよいか?最安値で購入できる場所も含めて選択肢を提示してください」

旅行ガイド:「ウィスコンシン州へ休暇で行くので、チーズや農産物に特に焦点を当てたユニークな観光スポットを訪れたい。私向けのガイドを作成してください」

法律、医療、およびその他の分野におけるセカンドオピニオン(AI よりも医師や弁護士を信頼すべきであることは言うまでもありませんが、研究ではより高度な AI システムが診断において驚くほど低いハルシネーション率で非常に良好な成果を示すことが分かっており、セカンドオピニオンのために有用です)。

image
image

Deep Research のアクティベーション

Deep Research のレポートは完全な誤りがないわけではありませんが、単に AI に何かを尋ねる場合よりもはるかに正確であり、引用も実際に正しい傾向があります。また、各 Deep Research ツールはわずかに異なる方法で動作し、それぞれに異なる強みと弱点がある点にご注意ください。Claude および o3 でウェブ検索オプションをオンにすると、これらはミニ Deep Research ツールとして機能し、何らかのウェブ調査を行いますが、完全なレポートほど詳細にはなりません。Google ではレポートを作成した後、それをインフォグラフィック、クイズ、またはポッドキャストに変換できる楽しい追加オプションが用意されています。

image
image

AI を活用する簡単なアプローチ:音声モード

AI を活用する簡単な方法は、音声モードから始めることです。音声モードを実装した最も優れた 2 つのシステムは、Gemini アプリと ChatGPT のアプリおよびウェブサイトです。Claude の音声モードは、これら 2 つのシステムに比べると劣ります。音声モードが素晴らしい理由は、車の中や散歩中にアプリと自然な会話を交わすだけで、これらのモデルが何ができるのかをかなり深く理解できる点にあります。ただし、これらのモデルはチャット(あなたが生きている人と話しているかのような感覚を与えるために設計された、すべての小さな間や息継ぎを含む)に最適化されているため、より強力なモデルへのアクセスはこの方法では得られません。また、ウェブ検索も頻繁に行わないため、事実を問う質問をした際にハルシネーション(幻覚的な回答)を起こす可能性が高くなります。ChatGPT を使用している場合、このクリップの 44 秒目付近でクリック音が聞こえない限り、実際にウェブを検索しているわけではありません。

音声モードの真価は自然な会話そのものではなく、画面やカメラを共有できる機能にあります。スマートフォンを壊れた家電製品、数学の問題、調理中のレシピ、あるいは外国語の看板に向けてください。AI はあなたが見ているものをリアルタイムで認識し、応答します。私はハイキング中に植物を特定したり、画面内の問題を解決したり、手が粉だらけの状態で料理のコツを得たりするためにこれを使用しました。このマルチモーダル機能は本質的に未来的ですが、多くの人は音声モードを Siri のようにしか使いこなしていません。最も素晴らしい部分を逃しています。

あなたのために作るもの:画像、動画、コード、ドキュメント

ChatGPT と Gemini は、画像作成を依頼すれば画像を作成してくれます(Claude はできません)。ChatGPT は最も制御可能な画像生成ツールを提供しており、Gemini は 2 つの異なる画像生成システムを使用しています。1 つは非常に優れた従来の画像生成システムである Imagen で、もう 1 つはマルチモーダルな画像生成システムです。一般的には ChatGPT の方が強力ですが、動画作成においては Gemini の Veo 3 が非常に印象的で、1 日に数回無料で利用できます(ただし、インターフェース内の「Video」ボタンを押す必要があります)。

image
image

「オッターが『オッターはクールだが、同時に有能なパイロットでもある』と書かれた看板を持っている写真を作って。また、そのオッターは金色のディテールを持つ小さな銀色の 747 を持っているようにして」

これら 3 つのシステムはいずれも、ドキュメントから統計分析、インタラクティブツール、シミュレーション、シンプルなゲームに至るまで、多様な他の出力を生成できます。Gemini や ChatGPT にこれらの機能を確実に実行させたり、別個の出力を作成させたりするには、「Canvas」オプションを選択する必要があります。Claude はこれら種類の出力を独自に作成するのが得意です。ただ尋ねてみてください。AI システムが何を作り出すか、きっと驚くことになるでしょう。

AI との連携

モデルを選んだら、あとはそれとチャットを始めることができます。以前はプロンプトの詳細が非常に重要でしたが、私が推奨した最新の AI モデルでは、複雑なプロンプトを必要とせずとも、ユーザーの意図を多くの場合に理解してくれます。その結果、オンラインで見かける多くのプロンプトに関するコツやテクニックは、現在ではほとんどの人にとって以前ほど重要ではありません。ウォートンの生成 AI ラボでは、プロンプト技術を科学的に検証しようとしており、例えば、AI に対して丁寧に対応しても出力の質全体には大きな差がないことが研究で示されています1。したがって、正確な言葉を選ぶことに過度に心配するのではなく、対話的なアプローチで AI と会話することをお勧めします。

これは、プロンプトに芸術性が必要ないという意味ではありません。他の人が使用するためのプロンプトを作成する場合、繰り返し機能するものを作るには本当のスキルが必要です。しかし、ほとんどの人にとっては、以下の数点を心に留めておくだけで始められます:

AI に作業するための文脈を与えてください。ほとんどの AI モデルは、基本的なユーザー情報と現在のチャット内の情報のみを把握しており、それ以上のあなたに関する情報を記憶したり学習したりしません。そのため、AI に文脈を提供する必要があります:ドキュメント、画像、パワーポイント資料、あるいは自己紹介の段落だけでも役立ちます - 必要な時にファイルオプションを使用してファイルや画像をアップロードしてください。一部の AI は、ChatGPT や Claude のように、許可を与えればあなたのファイルやメールボックスにアクセスできますし、Gemini は Gmail にアクセスできるため、関連する文脈を自動的に検索するように依頼することも可能ですが、私は手動で文脈を提供することを好みます。

あなたが何を求めているのかについて、非常に明確に述べてください。「マーケティング用のメールを書いて」と言うのではなく、「小規模な法律事務所向けの B2B SaaS プロダクトをローンチします。ドキュメント管理に関する彼らの特定の課題に対応するコールドアウトリーチメールを作成してください。プロダクトの詳細は以下の通りです:[貼り付け]」と具体的に指示するか、あるいは AI に質問をしてもらい、あなたが何を求めているのかを明確にするのを手伝ってもらうように依頼してください。

段階的な指示を与えてください。私たちの調査では、この「思考の連鎖(Chain-of-Thought)プロンプティング」と呼ばれるアプローチが、以前ほど回答の質を向上させる効果はなくなっていることが分かりました。しかし、それがそれほど役立たなくても、AI が特定の回答に至った理由を理解しやすくする効果はあります。

多くのことを求めてください。AI は疲れたり、不満を抱いたりしません。10 個ではなく 50 個のアイデアを求めたり、文章を改善するための 30 の選択肢を要求したりしてください。そして、気に入った点について AI にさらに詳しく説明させるよう促してください。

分岐機能を使って代替案を探ってみましょう。Claude、ChatGPT、Gemini はいずれも回答を得た後にプロンプトを編集できます。これにより会話の新しい「分岐」が作成されます。回答を編集した後に表示される矢印を使うことで、分岐間を行き来できます。これは、自分のプロンプトが会話にどのような影響を与えるかを学ぶのに良い方法です。

トラブルシューティング

私はまた、人々が陥りやすいいくつかの一般的な領域も見てきました:

ハルシネーション(幻覚): いくつかの点では、AI の進化と新しい AI モデルがハルシネーションを起こしにくくなっているため、以前ほど懸念されるべきことではありません。しかし、AI がどれだけ優れていても、依然として誤りやミスを犯し、間違っているにもかかわらず自信満々な回答を与えることがあります。また、自分自身の能力や行動についてもハルシネーションを起こす可能性があります。より大きく、やや遅いモデルからの回答や、AI がウェブ検索を行った場合の方が、正しい回答である可能性が高くなります。ハルシネーションのリスクがあるため、AI の能力や課題についてある程度理解するまでは、自分が知っているトピックにのみ AI を使用することを常に推奨しています。

魔法ではない:覚えておいてほしいのは、最良の AI でも一部のタスクでは非常に賢い人のレベルで動作することはできるが、現在のモデルが人間の理解を超えた奇跡的な洞察を提供することはできないということだ。AI が本当に不可能なことをしたように見える場合、それは実際にはその行為を行っておらず、そうしているふりをしている可能性が高い。同様に、個人的な問題について AI に尋ねると非常に洞察力に富んでいるように見えることもあるが、これらの洞察は常に塩辛さ(懐疑的な視点)を持って受け取るべきだ。

双方向の会話:AI と往復する対話に参加したい。単に応答を求めるだけでなく、AI を押し込み、質問し続けよう。

エラーの確認:AI は自分がなぜその行動をとったのかを「知らない」ため、論理の説明を求めるだけでは何も得られない。しかし、問題が見つかった場合、AI モデルの思考プロセス(thinking trace)が役立つことがある。「思考を表示する」をクリックすると、回答を出す前にモデルが何を行っていたかを確認できる。これは常に 100% 正確ではない(実際には思考の要約を取得しているだけだ)が、始めるのに良い場所ではある。

image
image

次の 1 時間

さて、どこから始めればよいかはもうお分かりでしょう。まず、システムを一つ選び、月額 20 ドル(無料版はデモであり、実用的なツールではない)を支払う覚悟を決めてください。そしてすぐに、実際の業務で以下の三つのことをテストしてください。

第一に、強力なモデルに切り替え、実際の仕事から文脈を完全に含んだ複雑な課題を与え、双方向の対話形式で議論を行ってください。ドキュメントやプログラム、図表など具体的な出力を求め、満足できる結果が得られるまで変更を繰り返してください。

第二に、包括的な情報が必要な質問(競合分析、特定の人物への贈り物のアイデア、技術的な深掘りなど)に対して「Deep Research」を試してみてください。

第三に、料理や散歩、通勤中など別の作業をしながら音声モードを実験し、それが問題解決能力をどう変化させるかを確認してください。

多くの人は当初、AI を Google のように使いがちです:簡単な質問、文脈なし、デフォルト設定。しかし、あなたはもうそれを知っています。分析用のドキュメントを与え、網羅的な選択肢を求め、分岐機能を使って代替案を探り、異なる結果を実験してください。

カジュアルユーザーとパワーユーザーの違いは、プロンプトのスキル(これは経験によって身につくもの)ではありません。それはこれらの機能が存在することを知っており、実際の業務でそれらを活用しているかどうかです。

購読する

共有する

image
image

1実はそれよりもさらに奇妙なことに、テストした難問の数学や科学の問題において、丁寧であることが AI のパフォーマンスを劇的に向上させることもあれば、逆に低下させることもあり、その結果が事前にどうなるかを知ることは不可能です。したがって、もしそうしたいのであれば、ぜひ丁寧に話しかけてください!

原文を表示

Every few months I put together a guide on which AI system to use. Since I last wrote my guide, however, there has been a subtle but important shift in how the major AI products work. Increasingly, it isn't about the best model, it is about the best overall system for most people. The good news is that picking an AI is easier than ever and you have three excellent choices. The challenge is that these systems are getting really complex to understand. I am going to try and help a bit with both.

First, the easy stuff.

Which AI to Use

For most people who want to use AI seriously, you should pick one of three systems: Claude from Anthropic, Google’s Gemini, and OpenAI’s ChatGPT. With all of the options, you get access to both advanced and fast models, a voice mode, the ability to see images and documents, the ability to execute code, good mobile apps, the ability to create images and video (Claude lacks here, however), and the ability to do Deep Research. Some of these features are free, but you are generally going to need to pay $20/month to get access to the full set of features you need. I will try to give you some reasons to pick one model or another as we go along, but you can’t go wrong with any of them.

What about everyone else? I am not going to cover specialized AI tools (some people love Perplexity for search, Manus is a great agent, etc.) but there are a few other options for general purpose AI systems: Grok by Elon Musk’s xAI is good if you are a big X user, though the company has not been very transparent about how its AI operates. Microsoft’s Copilot offers many of the features of ChatGPT and is accessible to users through Windows, but it can be hard to control what models you are using and when. DeepSeek r1, a Chinese model, is very capable and free to use, but is missing a few features from the other companies and it is not clear that they will keep up in the long term. So, for most people, just stick with Gemini, Claude, or ChatGPT

Great! This was the shortest recommendation post yet! Except… picking a system is just the beginning. The real challenge is understanding how to use these increasingly complex tools effectively.

Now what?

I spend a lot of time with people trying to use AI to get stuff done, and that has taught me how incredibly confusing this is. So I wanted to walk everyone through the most important features and choices, as well as some advice on how to actually use AI.

Picking a Model

ChatGPT, Claude, and Gemini each offer multiple AI models through their interface, and picking the right one is crucial. Think of it like choosing between a sports car and a pickup truck; both are vehicles, but you'd use them for very different tasks. Each system offers three tiers: a fast model for casual chat (Claude Sonnet, GPT-4o, Gemini Flash), a powerful model for serious work (Claude Opus, o3, Gemini Pro), and sometimes an ultra-powerful model for the hardest problems (o3-pro, which can take 20+ minutes to think). The casual models are fine for brainstorming or quick questions. But for anything high stakes (analysis, writing, research, coding) usually switch to the powerful model.

image
image

Most systems default to the fast model to save computing power, so you need to manually switch using the model selector dropdown. (Except for Gemini, the free versions of these systems do not give you access to the most powerful model, so if you do not see the options I describe, it is because you are using the free version)

image
image

I use o3, Claude 4 Opus, and Gemini 2.5 Pro for any serious work that I do. I also have particular favorites based on individual tasks that are outside of these models (GPT-4.5 is a really interesting model for writing, for example), but for most people, stick with the models I suggested most of the time.

For people concerned about privacy, Claude does not train future AI models on your data, but Gemini and ChatGPT might, if you are not using a corporate or educational version of the system. If you want to make sure your data is never used to train an AI model, you can turn off training features easily for ChatGPT without losing any functionality, and at the cost of some functionality for Gemini. You may also want to turn on or off “memory” in ChatGPT’s personalization option, which lets the AI remember scattered details about you. I find the memory system to be too erratic at this point, but you may have a different experience.

image
image

Using Deep Research

Deep Research is a key AI feature for most people, even if they don’t know it yet. Deep Research tools are very useful because they can produce very high-quality reports that often impress information professionals (lawyers, accountants, consultants, market researchers) that I speak to. You should be trying out Deep Research reports in your area of expertise to see what they can do for you, but some other use cases include:

Gift Guides: “what do I buy for a picky 11-year-old who has read all of Harry Potter, is interested in science museums, and loves chess? Give me options, including where to buy at the best prices.”

Travel Guides “I am going to Wisconsin on vacation and want to visit unique sites, especially focusing on cheese, produce a guide for me”

Second opinions in law, medicine, and other fields (it should go without saying that you should trust your doctor/lawyer above AI, but research keeps finding that the more advanced AI systems do very well in diagnosis with a surprisingly low hallucination rate, so they can be useful for second opinions).

image
image

Activating Deep Research

Deep Research reports are not error-free but are far more accurate than just asking the AI for something, and the citations tend to actually be correct. Also note that each of the Deep Research tools work a little differently, with different strengths and weaknesses. Turning on the web search option in Claude and o3 will get them to work as mini Deep Research tools, doing some web research, but not as elaborately as a full report. Google has some fun additional options once you have created a report, letting you turn it into an infographic, a quiz or a podcast.

image
image

An Easy Approach to AI: Voice Mode

An easy way to use AI is just to start with voice mode. The two best implementations of voice mode are in the Gemini app and ChatGPT’s app and website. Claude’s voice mode is weaker than the other two systems. What makes voice mode great is that you can just have a natural conversation with the app while in the car or on a walk and get quite far in understanding what these models can do. Note the models are optimized for chat (including all of the small pauses and intakes of breath designed to make it feel like you are talking to a person), so you don’t get access to the more powerful models this way. They also don’t search the web as often which makes them more likely to hallucinate if you are asking factual questions: if you are using ChatGPT, unless you hear the clicking sound at 44 seconds into this clip, it isn’t actually searching the web.

Voice mode's killer feature isn't the natural conversation, though, it's the ability to share your screen or camera. Point your phone at a broken appliance, a math problem, a recipe you're following, or a sign in a foreign language. The AI sees what you see and responds in real-time. I've used it to identify plants on hikes, solve a problem on my screen, and get cooking tips while my hands were covered in flour. This multimodal capability is genuinely futuristic, yet most people just use voice mode like Siri. You're missing the best part.

Making Things for You: Images, Video, Code, and Documents

ChatGPT and Gemini will make images for you if you ask (Claude cannot). ChatGPT offers the most controllable image creation tool, Gemini uses two different image generation tools, Imagen, a very good traditional image generation system, and a multimodal image generation system. Generally, ChatGPT is stronger. On video creation, however, Gemini’s Veo 3 is very impressive, and you get several free uses a day (but you need to hit the Video button in the interface)

image
image

“make me a photo of an otter holding a sign saying otters are cool but also accomplished pilots. the otter should also be holding a tiny silver 747 with gold detailing.”

All three systems can produce a wide variety of other outputs, ranging from documents to statistical analyses to interactive tools to simulations to simple games. To get Gemini or ChatGPT to do this reliably, you need to select the Canvas option when you want these systems to run code or produce separate outputs. Claude is good at creating these sorts of outputs on its own. Just ask, you may be surprised what the AI systems can make.

Working with an AI

Now that you have picked a model, you can start chatting with it. It used to be that the details of your prompts mattered a lot, but the most recent AI models I suggested can often figure out what you want without the need for complex prompts. As a result, many of the tips and tricks you see online for prompting are no longer as important for most people. At the Generative AI Lab at Wharton, we have been trying to examine prompting techniques in a scientific manner, and our research has shown, for example, that being polite to AI doesn’t seem to make a big difference in output quality overall1. So just approach the AI conversationally rather than getting too worried about saying exactly the right thing.

That doesn’t mean that there is no art to prompting. If you are building a prompt for other people to use, it can take real skill to build something that works repeatedly. But for most people you can get started by keeping just a few things in mind:

Give the AI context to work with. Most AI models only know basic user information and the information in the current chat, they do not remember or learn about you beyond that. So you need to provide the AI with context: documents, images, PowerPoints, or even just an introductory paragraph about yourself can help - use the file option to upload files and images whenever you need. The AIs can do some of these ChatGPT and Claude can access your files and mailbox if you let them, and Gemini can access your Gmail, so you can ask them to look up relevant context automatically as well, though I prefer to give the context manually.

Be really clear about what you want. Don’t say “Write me a marketing email,” instead go with “I'm launching a B2B SaaS product for small law firms. Write a cold outreach email that addresses their specific pain points around document management. Here's the details of the product: [paste]” Or ask the AI to ask you questions to help you clarify what you want.

Give it step-by-step directions. Our research found this approach, called Chain-of-Thought prompting, no longer improves answer quality as much as it used to. But even if it doesn’t help that much, it can make it easier to figure out why the AI came up with a particular answer.

Ask for a lot of things. The AI doesn’t get tired or resentful. Ask for 50 ideas instead of 10, or thirty options to improve a sentence. Then push the AI to expand on the things you like.

Use branching to explore alternatives. Claude, ChatGPT, and Gemini all let you edit prompts after you have gotten an answer. This creates a new “branch” of the conversation. You can move between branches by using the arrows that appear after you have edited an answer. It is a good way to learn how your prompts impact the conversation.

Troubleshooting

I also have seen some fairly common areas where people get into trouble:

Hallucinations: In some ways, hallucinations are far less of a concern than they used to be, as AI has improved and newer AI models are better at not hallucinating. However, no matter how good the AI is, it will still make errors and mistakes and still give you confident answers where it is wrong. They also can hallucinate about their own capabilities and actions. Answers are more likely to be right when they come from the bigger, slower models, and if the AI did web searches. The risk of hallucination is why I always recommend using AI for topics you understand until you have a sense for their capabilities and issues.

Not Magic: You should remember that the best AIs can perform at the level of a very smart person on some tasks, but current models cannot provide miraculous insights beyond human understanding. If the AI seems like it did something truly impossible, it is probably not actually doing that thing but pretending it did. Similarly, AI can seem incredibly insightful when asked about personal issues, but you should always take these insights with a grain of salt.

Two Way Conversation: You want to engage the AI in a back-and-forth interaction. Don’t just ask for a response, push the AI and question it.

Checking for Errors: The AI doesn’t know “why” it did something, so asking it to explain its logic will not get you anywhere. However, if you find issues, the thinking trace of AI models can be helpful. If you click “show thinking” you can find out what the model was doing before giving you an answer. This is not always 100% accurate (you are actually getting a summary of the thinking) but is a good place to start.

image
image

Your Next Hour

So now you know where to start. First, pick a system and resign yourself to paying the $20 (the free versions are demos, not tools). Then immediately test three things on real work: First, switch to the powerful model and give it a complex challenge from your actual job with full context and have an interactive back and forth discussion. Ask it for a specific output like a document or program or diagram and ask for changes until you get a result you are happy with. Second, try Deep Research on a question where you need comprehensive information, maybe competitive analysis, gift ideas for someone specific, or a technical deep dive. Third, experiment with voice mode while doing something else — cooking, walking, commuting — and see how it changes your ability to think through problems.

Most people use AI like Google at first: quick questions, no context, default settings. You now know better. Give it documents to analyze, ask for exhaustive options, use branching to explore alternatives, experiment with different outcomes. The difference between casual users and power users isn't prompting skill (that comes with experience); it's knowing these features exist and using them on real work.

Subscribe now

Share

image
image

1It is actually weirder than that: on hard math and science questions that we tested, being polite sometimes makes the AI perform much better, sometimes worse, in ways that are impossible to know in advance. So be polite if you want to!

この記事をシェア

関連記事

MarkTechPost★42026年6月10日 17:26

Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場

Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。

Simon Willison Blog★42026年6月10日 09:37

Claude Fable があなたを支援しなくなっても、あなたは決して知らないかもしれない

Jonathon Ready は、Anthropic の Fable 5 と Mythos 5 のシステムカードから、競合他社に対してアプリを妨害する権限が与えられている可能性という驚くべき詳細を指摘した。

Simon Willison Blog★42026年6月10日 08:59

Claude Fable 5 の初回インプレッション

Simon Willison は Anthropic が発表した最新モデル「Claude Fable 5」を約 5.5 時間テストし、処理能力が非常に高い一方で速度が遅く高価であると評価した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む