Claude Dispatch and the Power of Interfaces｜Claudeの配信とインターフェースの力 | AIニュース最前線

AI はすでに、多くの人が認識しているよりもはるかに能力が高いです。いわゆる「能力のオーバーハング」の大部分は、AI の限界（もちろんまだ多くの限界があります）から来るのではなく、人々が AI とどのように相互作用するかから来ています。绝大多数の人がチャットボットを通じて AI にアクセスしており、通常はより能力が低いモデルを搭載した無料版を利用しています。チャットボットは簡単な質問には適していますが、実際の業務を遂行するための手段としては不適切です。 実際、最近の研究では、チャットボットインターフェースを使用して作業を行う際に、精神的な負担が生じることが示唆されています。新しい論文では、小規模な金融専門家グループに GPT-4o1 を用いた複雑なバリュエーション（評価）タスクを行わせ、会話の逐次記録から認知負荷を測定しました。AI の利用により生産性が向上することは確認されましたが、その一部は、AI が情報を提示する方式によって人々が完全に圧倒されてしまったという事実によって相殺されているように見えます：巨大なテキストの壁、新たなトピックへの誘導、そして広がりすぎた議論です。チャットボットのインターフェース自体が障害となっており、作業内容ではありませんでした。一度会話が混乱すると、その状態は維持されます。親切であるよう最適化された AI は、ユーザーが提供した整理されていない構造をそのまま反映するだけで、圧倒されたユーザー側も再組織化を行いません。両者が互いに問題を悪化させていたのです。最も被害を受けたのは経験の浅い労働者たちであり、彼らはまさに AI から最大の恩恵を受けるべき人々ですが……もし自分が何をしているかを把握し続けることができればの話です。 チャットボットを使って何かを完了させた経験があれば、これは驚くべきことではないはずです。特定の質問をすると、答えが含まれている（どこかに！）5 段落の回答が得られる一方で、AI はあなたが尋ねていない新しい事柄も3 つ提案します。このインターフェース自体が認知コストを生み出し、AI の知能による恩恵を圧倒してしまいます。では、より良いインターフェースとはどのようなものなのでしょうか？ 専門化されたインターフェース 特定の業務やタスクのために特化したインターフェースを構築するという選択肢があります。すべての専門化された AI インターフェースの中で、本当に完成度が高いのはプログラミングに関するものです。これはまさに予想される通りで、AI 研究所はプログラマーによって構成されており、モデルはコードに対して徹底的にトレーニングされています。また、これらのツールを構築している人々は、しばしば自分自身のためにそれらを作っているのです。 以前、Anthropic のコーディングエージェントである Claude Code について書いたことがあります。これは数時間にわたって自律的に作業できるツールです。OpenAI の Codex や Google の Antigravity も同様の機能を備えています。私は Claude Code を、わずかな収入を得ることからゲーム制作に至るまで、一切コードに触れることなく利用してきました。また、Codex も同程度の能力を備えており、非常に有用だと感じています。これらのツールは素晴らしいものですが、実際にはプログラマー向けに設計されています。Python や Git の知識があることを前提としており、そのインターフェースはまるで 1980 年代のコンピュータラボのようです。開発者ではない知識労働者の 99% にとって、こうした強力な AI ツールは最適化されていません。 ![image](https://substackcdn.com/image/fetch/$s_!q5Uz!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F0b00d345-c3f5-4fc2-8837-75073b845c32_2356x528.png) Pomelli、Stitch、そして NotebookLM AI ラボの中で、Google は他の専門職向けに特化したインターフェースを構築する実験を最も多く行っているようです。すべてがまだ端が荒い状態ですが、これは AI ツールが他の種類の知識労働者向けに作られた未来がどのようなものかを示しています。Google の Stitch は、AI ネイティブなデザインがどのように見えるかを示唆しています — 自然言語でアプリを記述すると、一貫したデザインシステムを持つ複数の相互接続された画面が得られる無限のキャンバスです。同様に、Pomelli ではウェブサイトの URL を貼り付けるだけで、ブランドに合わせたソーシャルメディアキャンペーンを自動的に生成します。これは技術的なプロンプトではなく、マーケティングの言語を用いて、より直感的で技術的でない体験を提供します。そして最もよく知られているのは NotebookLM で、多様な情報源を調査し、表示し、操作するための手段を提供しています。これらすべてが今後の方向性を示していますが、まだ Claude Code がプログラマー向けに提供するような変革的なツールという段階には至っていません。しかし、爆発的な成長を遂げている別のインターフェースとして、パーソナルエージェントがあります。 すでに持っているインターフェースを使用する もしご存知ない方のために、OpenClaw はオープンソースの AI エージェントであり、そのシンボルは赤いロブスターです。セキュリティ上の悪夢とも呼ばれますが、歴史上最も急速に成長したオープンソースプロジェクトとなりました。OpenClaw がこれほどまでに成功しているのは、それが真のパーソナルエージェントだからです。このシステムでは、WhatsApp や Telegram、Slack など、普段人とのテキストメッセージに使っている同じアプリを通じて AI エージェントと対話できます。メールを確認したり、テーブルを予約したり、ファイルを探したりと指示を出すと、AI があなたのコンピュータ上でそれらの作業を実行してくれます。これは回顧すると明白に思える方法で、インターフェースの問題を解決しました：チャットボットやコマンドラインではなく、WhatsApp といったすでに非常に親しみのあるインターフェースを通じて、まるで人間に対話するかのように AI と話すことを可能にしたのです。 ![image](https://substackcdn.com/image/fetch/$s_!bhGJ!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F42236cb8-55bd-4bb3-a0e8-2671ce9a2f05_2391x1283.png) しかし、OpenClaw は使いにくく、多くのセキュリティリスクをもたらします。Anthropic の答えは、Claude Cowork with Dispatch です。今年 1 月に発売された Cowork は、知識労働者向けの Claude Code のバージョンです。これはデスクトップワークスペースを通じて、Claude にローカルファイルやアプリケーションへのアクセス権を与えます。また、コネクタを介して数十のアプリに接続し、コネクタが存在しない場合は、マウスとキーボードを直接制御するバックアップ機能も備えています。ここ数週間で登場した Dispatch は、重要な要素を追加しました：デスクトップ上で作業している間でも、スマートフォンから Claude にメッセージを送信できるのです。QR コードを読み込むだけで、スマホがコンピューター上の AI エージェントの遠隔操作コントローラーになります。 Dispatch と Claude Code を組み合わせることで、有能なアシスタントに話しかけているかのようなインターフェースが生まれます。例えば、スマホから Claude に朝のブリーフィング作成を依頼すると、カレンダーやメール、オンラインチャネルから情報を取得し、次に何をすべきかのレポートを作成してくれます。しかし Cowork はより複雑な作業もこなします。スマホから、最近作成したプレゼンテーションを確認し、スライド 3 のグラフが最新かどうかをチェックし、もし古ければ更新するよう依頼しました。結果は非常に印象的でした（ある場所で少しつまずきましたが、その原因はサイトがファイルのダウンロードをブロックしていたためです）。Cowork は PowerPoint を開いて「閲覧」し、より最新のデータを探すために私のコンピュータ全体を検索しました。さらに、より最新の内容を含むオンライン論文へのリンクを提供すると、PDF をダウンロードして新しいグラフを見つけ、グラフの画像を切り出し、私の PowerPoint ファイルを自動的に更新してくれました。これは洗練された複雑な作業であり、常に完璧にスムーズとは限りませんが、それでも多くの時間を節約できるレベルです。 ![image](https://substackcdn.com/image/fetch/$s_!c3Lr!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F21982406-3d63-459e-bcf5-4f3731c7dec2_1693x1113.png) これが OpenClaw と同等の柔軟性を持っているかといえば、いいえ。Cowork はサンドボックス化されており、より安全ですが制限も多くなります（ただしセキュリティリスクがないという意味ではありません）。コネクタのエコシステムは成長中ですが、まだ完全ではありません。また、Cowork があなたのコンピュータを使用できるというアイデアは概念としては印象的ですが、実践ではエラーが発生しやすいものです。しかし、核心となる洞察は OpenClaw がたどり着いたものと同じです。人々はチャットボットを求めているのではありません。彼らが求めているのは、実際のファイルやツールを使って作業し、人間と話すかのようにアクセスできるエージェントです。 オンデマンドのインターフェース これらすべては、私たちが事前にインターフェースを決める必要があるという前提に基づいています。しかし、最新の AI システムは実際にあなたのためにインターフェースを構築することができます。例えば、ここ数週間で Claude は会話内で直接可視化データを生成する機能を獲得しました。これらは静的な画像ではありません。インタラクティブで調整可能であり、Claude はフォローアップの質問に応じてそれらを修正できます。 ![image](https://substackcdn.com/image/fetch/$s_!tmFI!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F45e99e6d-10df-4f09-90c9-c34ed3eebf44_2102x1593.png) これはインターフェース問題に対する異なるアプローチです。あらゆる種類の作業のために企業が専用のインターフェースを構築するのではなく、AI がその場で適切なインターフェースを生成します。私は、未来には「すべてを支配する一つのインターフェース」があるのではなく、その瞬間に最適なインターフェースを生成する AI があり、デスクトップ上のエージェント、会話内のチャート、問題を解決するためのカスタムアプリが存在すると考えています。私たちは、AI のインターフェースに適応することから、AI が自らのインターフェースをユーザーに適応させることへと移行しています。 AI の能力は、AI のアクセシビリティ（利用のしやすさ）よりも先に発展してきました。モデルはすでに相当な間、驚異的なことを実行できるほど賢くなっていますが、私たちはその知能に人々がアクセスする手段としてチャットボットを利用してきました。そして、その認知負荷に関する研究が示すように、チャットボットの形式は人々にとって実際に逆効果となっています。インターフェースが改善されるにつれて、より多くの人々が AI の能力を実際に活用できるようになったときに何が起きるのかを見ていくことになります。たとえモデル自体が変わらなくても（ただしモデルもなお変化し続けていますが）、そのギャップの一部でも埋める新しいインターフェースが登場するたびに、それは AI 能力の飛躍のように感じられるでしょう。私の推測では、人々が時々示す「AI への失望」の多くは、AI が悪いからではなく、インターフェースが不適切だったことに起因します。私たちは近年で最も強力な技術の一つを構築したのに、それをチャットウィンドウに入力することでアクセスさせるようにしてしまったのです。これはまもなく変わります。 購読する 共有 古く AI モデルに基づいた主張をする論文については常に警戒するのが良いことですが、このケースでは、現在 obsolete となった GPT-4o と GPT-5.4（あるいはそれ以降のバージョン）の間には大きな変化はないと疑われます。なぜなら、両者とも壁のようなテキストの塊を示しているからです。

Claudeの配信とインターフェースの力

背景や根拠まで確認しますか？

関連記事

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する