エージェント時代におけるAI活用法ガイド

私は ChatGPT が登場して以来、この種のガイドを8本書いてきましたが、今回のバージョンは過去との決定的な断絶を表しています。なぜなら、「AI を使う」という意味が劇的に変化したからです。数ヶ月前まで、大多数の人にとって「AI を使う」とは、チャットボットと往復の会話を行うことを意味していました。しかしここ数ヶ月で、AI をエージェントとして実用的に利用することが可能になりました。タスクを割り当てれば、適切なツールを活用してそれを実行してくれます。この変化により、どの AI を使用するかを決定する際には、3 つの要素を考慮する必要があります：モデル（Models）、アプリ（Apps）、そしてハーンセス（Harnesses）。 ![image](https://substackcdn.com/image/fetch/$s_!0VjC!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F59cd7383-bdba-4322-8714-006f0157e0e1_4582x1337.png) 同じモデルである Claude Opus 4.6 が、全く同じ質問「ChatGPT と Claude と Gemini を比較してください」を、3 つの異なるアプリとハーンセスで尋ねてみました。ハーンセスを使用しない場合、情報は古くなっています。Claude.ai のサイトでは、更新された情報と検証可能なソースが得られます。一方、Claude Cowork を使用すると、洗練された分析と整然とした対比比較が得られます。 モデルは基盤となる AI の頭脳であり、主要な 3 つは GPT-5.2/5.3、Claude Opus 4.6、Gemini 3 Pro です（各社は過去よりもはるかに速いペースで新モデルをリリースしているため、今後数週間でバージョン番号が変更される可能性があります）。これらがシステムの知能の度合い、推論能力、文章作成やコーディング、スプレッドシート分析における性能、画像の認識や生成能力を決定します。モデルはベンチマークで測定される対象であり、AI 企業が競って改善しようとするものです。「Claude は文章作成が得意」「ChatGPT は数学に強い」と言う場合、それはモデルについて話しているのです。 アプリは実際にモデルと対話し、モデルに実務を行わせる製品です。最も一般的なアプリは各モデルのウェブサイト（chatgpt.com、claude.ai、gemini.google.com）であり、あるいはスマートフォン用の同等アプリケーションです。さらに、OpenAI Codex や Claude Code といったコーディングツールや、Claude Cowork などのデスクトップツールなど、各 AI 企業が提供する他のアプリも増えています。 ハーネスとは、AI モデルの力を実際の作業に活用させる仕組みです。馬車や農耕具を引くために馬の生きた力を引き出す馬具と同じように、ハーネスは AI がツールを使用し、行動を起こし、単独で多段階のタスクを完了できるようにするシステムです。 アプリにはハーネスが備わっています。ウェブサイトの Claude には、Claude 4.6 Opus に Web 検索やコード作成を可能にするハーネスがあり、同時にスプレッドシートの作成やグラフィックデザイン作業など、さまざまな問題へのアプローチ方法に関する指示も含まれています。一方、Claude Code はさらに広範なハーネスを提供しており、Claude 4.6 Opus に仮想コンピュータ、Web ブラウザ、コードターミナルを与え、これらを組み合わせてゼロから新しいウェブサイトの調査、構築、テストを実際に行うことができるようにします。 Manus（最近 Meta によって買収されました）は、複数のモデルを包み込むスタンドアロンのハーネス essentially でした。最近大きな話題となった OpenClaw は、主にコンピュータ上で任意の AI モデルを使用可能にするハーネスです。 最近まで、あなたはこれを知る必要はありませんでした。モデルこそが製品であり、アプリはウェブサイトそのものであり、ハーン（制御基盤）は最小限のものでした。ユーザーが入力し、システムが応答し、また入力する。現在では、同じモデルでも、それが動作しているハーンによって非常に異なる振る舞いを示す可能性があります。チャットウィンドウであなたと対話する Claude Opus 4.6 と、Claude Code の内部で自律的に数時間にわたってソフトウェアの記述とテストを行う Claude Opus 4.6 では、体験は全く異なります。質問に答える GPT-5.2 と、ウェブサイトをナビゲートしてスライドデッキを構築する GPT-5.2 Thinking では、体験が非常に異なるのです。 これは、「どの AI を使うべきか」という問いに対する答えが以前よりも難しくなったことを意味します。なぜなら、その答えはあなたがそれを使って何を実現しようとしているかに依存するためです。では、この風景（ランドスケープ）を一緒に見ていきましょう。 現在のモデルたち 上位モデルは全体的な能力において驚くほど互角であり、以前にも増して「賢く」、エラーも極めて少ないです。しかし、高度な AI を本格的に活用したいのであれば、月額少なくとも 20 ドルを支払う必要があります（ただし、世界の特定の地域ではより安価な代替プランが存在します）。この 20 ドルで得られるのは、使用するモデルを選択できる権利と、より先進的なフロンティアモデルやアプリケーションを利用する能力の 2 つです。現在利用可能な無料モデルが有料モデルと同程度に優れているとお伝えできればよいのですが、残念ながらそうではありません。無料モデルはすべて正確性よりもチャット体験に最適化されており、非常に高速で会話相手として楽しいことが多いものの、精度と能力は大幅に劣ります。実際、誰かが AI が愚かな行動をする例を投稿している場合、それは無料モデルを使用しているか、あるいはより賢いモデルを選択しなかったことが原因であるケースがほとんどです。 主要なフロンティアモデルの3大巨頭は、Anthropic の Claude Opus 4.6、Google の Gemini 3.0 Pro、そして OpenAI の ChatGPT 5.2 Thinking です。これらの選択肢を利用すれば、音声モード機能や画像・ドキュメントの閲覧機能、コード実行機能、優れたモバイルアプリ、さらに画像や動画の作成機能（ただし Claude はここが弱点です）を備えた最高峰の AI モデルにアクセスできます。それぞれ異なる個性と強み・弱みを持っていますが、多くの場合、自分が最も気に入ったものを選ぶだけで十分でしょう。現時点では、この分野の他の企業はモデル面でもアプリやハーンネス（基盤システム）面でも後れを取っており、一部のユーザーにはそれらを選択する理由があるかもしれませんが。 ![image](https://substackcdn.com/image/fetch/$s_!uPZ-!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F58559981-9fb2-4a07-b3e6-b3d0d73914e8_1205x428.png) これは少し誇張した表現ですが、正解であることが重要ではないカジュアルな会話であれば小型モデルを使用することも可能です。それ以外の場合は、必ず高度なモデルを選んでください！ AI アプリ（これらについては後ほど詳しく説明します）を使用する際、電話アプリやウェブサイトを含め、あなたが最も重視すべきことは適切なモデルを選ぶことです。しかし、AI 企業はこれを容易にしていません。単にチャットをするだけならデフォルトのモデルで十分ですが、実際に作業を行う場合はそうはいきません。ChatGPT では、無料版か有料版かを問わず、割り当てられるデフォルトモデルは「ChatGPT 5.2」です。問題は、GPT-5.2 が単一のモデルではなく、非常に弱い GPT-5.2 mini から優れた GPT-5.2 Thinking、そして極めて強力な GPT-5.2 Pro までを含む複数のモデルの集合体である点にあります。GPT-5.2 を選択すると、実際には「自動」モードが有効になり、AI がどのモデルを使用するかを決定します。その際、しばしば性能の低いモデルが選ばれます。有料版を利用すれば、使用するモデルを自分で選べるようになります。さらに複雑になるのは、モデルが回答に対してどれほど深く「思考」するかを選択できる点です。複雑なタスクには、私は常に手動で GPT-5.2 Thinking Extended（月額 20 ドルのプラン）または GPT-5.2 Thinking Heavy（より高価なプラン）を選択します。非常に難しい問題で多くの思考を要する場合は、最も強力なモデルである GPT-5.2 Pro を選択できますが、これはより高額な料金 tiers のみで利用可能です。 Gemini には3つの選択肢があります：Gemini 3 Flash、Gemini 3 Thinking、そして一部の有料プランでは Gemini 3 Pro です。Ultra プランに加入すれば、非常に困難な問題に対して Gemini Deep Think にアクセスできるようになります（これは別のメニューにあります）。真剣に取り組むべき問題については、必ず Gemini 3 Pro または Thinking を選択してください。 Claude の場合は、Opus 4.6 を選ぶ必要があります（新しい Sonnet 4.6 も強力ですが、やや劣ります）。「extended thinking」スイッチをオンにすることも忘れないでください。 再び申し上げますが、多くのユーザーにとって、モデル間の違いはすでに小さくなっているため、アプリやハッチス（harness）の方がモデルそのものよりも重要になっています。これが、より大きな問いへと私たちを導きます。 チャットボットのインターフェース 圧倒的多数の人は、AI モデルにアクセスするために ChatGPT、Claude、Gemini の主要ウェブサイトまたはモバイルアプリであるチャットボットを使用しています。事実上、チャットボットは最も重要で広範な AI アプリケーションと呼べるものです。ここ数ヶ月で、これらのアプリは互いにかなり異なるものへと進化しました。 いくつかの違いは、AI と一緒にバンドルされている機能にあります： Gemini チャットボットにバンドルされており（小さなプラスボタンからアクセス可能）：nano banana（現在の最高峰の AI 画像生成ツール）、Veo 3.1（主要な AI 動画生成ツール）、Guided Learning（学習を試みる際に、AI がよりチューターのように振る舞うのを支援）、そして Deep Research にアクセスできます。 ChatGPT にバンドルされている機能には、プラスボタンからアクセスできるさらに多種多様なオプションが含まれています。画像作成（画像生成モデルはほぼ nano banana に匹敵しますが、チャットボットからは Sora 動画クリエイターにアクセスできません）、学習と勉強（Gemini のガイド付き学習に相当しますが、なぜかクイズ作成機能も別途用意されています）、深層調査およびショッピングリサーチ（驚くほど優秀で見過ごされがちです）などがあり、その他多くの人が頻繁には使わないであろう一連のオプションも含まれていますが、これらについてはここでは取り上げません。 Claude には深層調査がバンドルされた唯一のオプションですが、プロジェクトを作成して学習用プロジェクトを選択することで、学習モードにアクセスできます。 すべての AI モデルはデータへの接続を可能にしており、例えば AI にメールやカレンダーを読み込ませたり、ファイルにアクセスさせたり、他のアプリケーションと連携させたりすることができます。これにより AI の有用性が大幅に向上しますが、やはり各 AI ツールで利用可能なコネクタのセットは異なります。 これは混乱を招きます！実際の業務を行う多くの人にとって、最も重要な追加機能は深層調査と、AI を自分のコンテンツに接続させることですが、他の機能についても試してみたいと思うかもしれません。しかし次第に重要視されるのは、ハネス（AI がアクセスできるツール群）です。そしてここにおいて、OpenAI と Anthropic は Google に対して明確なリードを握っています。Claude.ai と ChatGPT の両方とも、コードの作成と実行、ファイルの提供、広範な調査の実行など、多くの機能を持っています。一方、Google の Gemini ウェブサイトは（その AI モデル自体は同等に優秀であるにもかかわらず）、はるかに能力が劣ります。 ご覧の通り、ChatGPT と Claude では同様の質問に対して動作するスプレッドシートやパワーポイント資料を生成でき、追跡可能な明確な引用も提供してくれます。一方、Gemini はどちらの種類の文書も作成できず、引用やリサーチ機能も提供していません。ただし、Google はすぐにこの点を追いつけると予想しています。 チャットボットに関する最後の注意点として、GPT-5.2 Pro は付属のハーン（harness）とともに非常に賢いモデルです。これは直近で物理学における新規結果の導出を支援したモデルであり、複雑な統計解析や分析作業において最も能力が高いと私が考えるモデルでもあります。ただし、より高額なプランを通じてのみアクセス可能です。Google Gemini 3 Deep Think も同様に非常に有能力ですが、同じくハーンの問題を抱えています。 ![image](https://substackcdn.com/image/fetch/$s_!YiA6!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbf7efcae-93af-4ebf-bc6e-dbad488b63c8_1892x2888.png) プロンプト：「あなたは経済社会学者です。このデータを用いて検証可能な新規仮説をいくつか導き出し、高度な実験を行い、その結果を教えてください。」と入力し、大規模な Excel データセットを提供しました。 その他のアプリおよびハーン チャットボットのウェブサイトは、人々が AI と対話する主な場所ですが、最も印象的な成果が生まれる場所ではなくなりつつあります。これらの同じモデルをより強力なハッチ（harness）で包み込む他のアプリケーション群が増加しており、それらの重要性も高まっています。 Claude Code、OpenAI Codex、そして Google Antigravity はこれらの中で最も開発が進んだものであり、すべてがプログラマーを対象としています。それぞれが AI モデルにコードベースへのアクセス権、ターミナルへの接続、そして自らコードを書き、実行し、テストする能力を与えます。あなたが何を構築したいかを記述すると、AI がそれを実行し、完了するか行き詰まった時に報告します。もしあなたが職業としてコーディングを行っているなら、これらのツールはあなたの仕事を根本から変えています。最も広範なハッチを備えているため、たとえあなたがコードを書かない場合でも、これらは依然として莫大な作業を遂行することができます。 例えば、数年前に私は、GPT-1 のすべての内部重みとパラメータ（AI のコードであり、1 億 1700 万個の数値としてリストされている）を一連の書籍として提供することで、完全に紙ベースの LLM（大規模言語モデル）をどのように作成するかについて興味を持ちました。理論的には、十分な時間をかければ、これらの数値を使って手動で AI の計算を行うことが可能です。これは面白いアイデアのように思えましたが、明らかに実行する価値はありませんでした。しかし先週、私は Claude Code にそれを私に代わって実行するように依頼しました。約 1 時間ほどの間（主に AI が作業し、私がいくつかの提案をするという形でしたが）、GPT-1 の全内容を収めた 80 巻の美しくレイアウトされた書籍を作成し、計算方法に関するガイドも付与しました。さらに、各巻の表紙を考案して実行し、内部の重みを視覚化したデザインも施しました。その後、非常に洗練されたウェブサイト（以下のアニメーションを含む）を組み立て、Stripe を通じて決済機能を接続し、Lulu にオンデマンド印刷を依頼し、全体をテストした上で、私のためにリリースまで完了させました。私は一度もコードに触れたり見たりしたりしていません。私が試みたのは、コストで 20 冊を販売して反応を見ることでしたが、その日はすぐに完売しました。現在、すべての巻は同サイト上で無料の PDF として入手可能です。今では、以前なら多くの作業が必要だった小さなプロジェクトのアイデアさえあれば、私の側での努力をほとんど必要とせずに実行させることができます。 しかし、コーディング用のハーンセス（開発環境）はまだアマチュアにとってリスクが高く、明らかにコーディングに焦点を当てたものです。新しいアプリやハーンセスは、他の種類の知識労働にも注目を集め始めています。 Claude for Excel や PowerPoint は、アプリケーション内部の特定のハーンネスの例です。これら両方とも、これらのプログラムに対する非常に印象的な拡張機能を提供しています。特に Claude for Excel は、スプレッドシートを扱う際の働き方に大きな変化をもたらすものであり、Excel を職業として使用する人々にとって Claude Code と同様のインパクトを持つ可能性があります - ますます、AI に何をしたいかを伝えるだけで、それがジュニアアナリストのような役割を果たして作業を実行してくれます。結果が Excel 内に残るため、確認も容易です。Google は Google Sheets との統合を一部持っていますが（それほど深くはありません）、OpenAI には同様の製品は実質的に存在しません。 ![image](https://substackcdn.com/image/fetch/$s_!IOnc!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fcc527f70-b3e4-498b-80bb-bfa03f24dd5b_1900x1175.png) Claude Cowork は本質的に新しいものであり、独自の分類に値します。Anthropic によって1月にリリースされたこのツールは、非技術的な作業向けの Claude Code とほぼ同等のものです。デスクトップ上で動作し、ローカルファイルやブラウザと直接連携できます。ただし、Claude Code に比べてセキュリティが格段に高く、非技術ユーザーにとって危険性は低いです（詳細に関心のある方のために言えば、デフォルトで拒否するネットワーク設定と堅牢な分離機能が組み込まれた仮想マシン上で動作します）。あなたは成果物を指示するだけで（これらの経費報告書を整理する、これらの PDF からデータをスプレッドシートに抽出する、要約文を作成するなど）、Claude が計画を立て、それをサブタスクに分解し、あなたが監視している間（あるいはしていない間）でもあなたのコンピュータ上で実行してくれます。これは Claude Code と同じアジェンシーアーキテクチャの上に構築されており、自身も約2週間で Claude Code によって大半が作成されました。現時点では OpenAI や Google に直接同等の製品はありません。Cowork はまだ研究プレビュー段階であり、初期段階のため利用制限をすぐに使い果たす可能性がありますが、これはすべてが向かっている方向を明確に示しています：あなたの仕事について話すだけでなく、実際にあなたの仕事を遂行する AI です。 ![image](https://substackcdn.com/image/fetch/$s_!5NR5!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F933c53d7-43f9-455e-b4e7-2ee52f4a33ee_1565x1184.png) NotebookLM を使えば、左側に調査レポートの実施やソースドキュメントの収集を行い、中央側でその資料に対して質問を投げかけ、右側ではスライドショーなどの成果物に変換することができます。 NotebookLM は Google が異なる課題に対する回答として提供しているツールです。つまり、大量の情報から意味を見出すために AI をどう活用するかという問いへの答えです。NotebookLM に自身で深層調査を行わせることもできますし、ユーザーが自身の論文、YouTube 動画、ウェブサイト、ファイルなどを追加して、クエリ可能なインタラクティブなナレッジベースを構築することも可能です。このナレッジベースはスライドやマインドマップ、動画に変換でき、最も有名なのは AI が生成したポッドキャストです。2 人のホストがあなたの資料について議論する形式で、ホストの発言中に割り込んで質問することもできます。学生、研究者、あるいは文書の山から意味を見出す必要がある方々にとって、NotebookLM は非常に有用なツールです。 そして、OpenClaw もあります。これはどのカテゴリにもきれいに当てはまらないため、あえて言及するものですが、おそらく絶対に使用すべきではありません。OpenClaw は 1 月下旬にバズったオープンソースの AI エージェントです。あなたのコンピュータ上でローカルで動作し、好きな AI モデルに接続でき、WhatsApp や iMessage などの標準的なチャットツールを使って人間と会話するかのように操作できます。ウェブ閲覧、ファイル管理、メール送信、コマンド実行も可能です。いわば、あなたのマシン上に常駐する 24 時間 365 日のパーソナルアシスタントです。しかし、これは深刻なセキュリティリスクでもあります。AI にコンピュータやアカウントへの広範なアクセス権限を与えることになり、あなたがどのような危険にさらされているのかを誰も正確には知り得ないからです。ただし、これが今後どこへ向かっているかの兆候としては機能しています。 今何をすべきか これは多くの情報かもしれません。簡潔にまとめましょう。 もしこれから始められるのであれば、3 つのシステム（ChatGPT、Claude、または Gemini）のうちいずれか 1 つを選び、20 ドルを支払って上級モデルを選択してください。私の著書からのアドバイスは依然として有効です：AI を行うすべての活動に招待してください。実際の業務で使い始めてください。実際に作業中のドキュメントをアップロードしてください。RFP（提案依頼書）や SOP（標準作業手順書）の形式で非常に複雑なタスクを AI に与えてください。双方向の対話を重ね、AI を追い込んでみてください。これだけで、どんなガイドよりも多くのことを学べるはずです。 すでにチャットボットの使い方に慣れているなら、特定のアプリを試してみてください。NotebookLM は無料で使いやすく、良い出発点となります。さらに深く掘り下げたい場合は、Anthropic が提供する最も強力なパッケージとして、Claude Code や Claude Cowork（どちらも Claude Desktop からアクセス可能）に加え、PowerPoint 用や Excel 用の専門プラグインがあります。これらを実際に試してみてください。デモとしてではなく、実際に必要なタスクを任せてみてください。その動作を観察し、間違えた際には導いてあげてください。あなたはプロンプトを打っているのではなく（私が前回のエッセイで書いたように）、管理しているのです。 チャットボットからエージェントへの移行は、ChatGPT の登場以来、人々が AI を利用する方法において最も重要な変化です。まだ初期段階であり、これらのツールはまだ理解しにくく、奇妙な行動をとることもあります。しかし、何かを実行する AI は、単に言葉を語る AI よりも本質的に有用であり、そのように使いこなす方法を学ぶことは、あなたの時間を無駄にするものではありません。 購読する 共有する ![image](https://substackcdn.com/image/fetch/$s_!O-pO!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Ff77c79c7-9fb2-4cd0-b075-a6201a212a6c_1456x816.png)

エージェント時代におけるAI活用法ガイド

背景や根拠まで確認しますか？

関連記事

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する