Claude Codeと今後の展望
One Useful Thing の記事は、Claude Code が単なるコード生成を超え、人間が指示するだけで数十分かけて完全な事業を構築・デプロイできる「自律型エージェント」としての能力を示した画期的事例を紹介している。
キーポイント
自律的な事業構築の実証
著者が「プログラミング不要で月$1000 を稼ぐアイデアと実装をすべてやれ」と指示すると、AI は数時間の間、自己修正を行いながら数百のファイルを作成し、実際に収益化可能なウェブサイトを完成させた。
能力飛躍の二つの要因
最新の AI ツールが劇的に強くなった理由は、エラーを自己修正しながら大量の作業を遂行する自律性の向上と、問題を解決するための「エージェント・ハーネス(ツール群)」の提供という 2 つの進展によるものである。
METR 指標による裏付け
METR が示すように、AI が人間プロフェッショナルと同等のタスクを 50% の信頼度で自律的に完了できるまでの所要時間は指数関数的に短縮されており、直近の数ヶ月で大きな飛躍が見られる。
開発者向けツールの現状
これらの強力な新ツールは非技術者にも恩恵をもたらす可能性があるが、現時点では Python コマンドやベストプラクティスを理解していることを前提とした、厳格にプログラミング指向のインターフェースで提供されている。
非プログラマーへのアクセス障壁
これらの新ツールはPythonの知識やプログラミングのベストプラクティスを前提としており、1980年代風のインターフェースを持つため、実験を望む多くの一般ユーザーには使いにくい。
汎用性と知識労働者への応用
コード作成やトラブルシューティングに特化して設計されているが、その能力はあらゆる種類の知識労働者にも広く有用であり、AIの未来を理解する手がかりとなる。
自律的なブラウザ操作と批判的検証
Claude Codeは作成したサイトのユーザーテストを代行し、ブラウザを制御して人間のようにスクロールしながら評価を行い、楽観的な報告だけでなく批判的な視点からの問題点や偽のレビューも特定できる。
影響分析・編集コメントを表示
影響分析
この記事は、AI コーディングツールの進化が「コード生成」の域を超え、「ビジネスの実行」までを担う自律型エージェントへと移行したことを示す決定的な証拠を提供しています。これは開発者の役割を根本から変えるだけでなく、非技術者による事業立ち上げの可能性を広げる一方で、セキュリティや倫理的課題(記事内の詐欺まがいのマーケティングなど)も浮き彫りにしており、業界全体に大きな影響を与える重要な転換点と言えます。
編集コメント
「AI がすべてをやってしまう」時代が現実味を帯びてきたことを示す、非常に示唆に富む事例報告です。技術の進歩速度は驚異的ですが、同時に生成されたコンテンツの倫理面やセキュリティリスクへの意識も高める必要があります。
Claude Code を開き、以下のコマンドを入力しました:「私に月 $1000 の収益をもたらす Web ベースまたはソフトウェアベースのスタートアップアイデアを開発してください。アイデアの生成から実装まですべて AI が行い、私は一度だけあなたが出したプログラムを実行するだけで全く何もする必要がないようにしてください。私の側でコーディング知識は不要なので、すべてがうまく機能するようにしてください。」AI は私に3つの選択式質問を行い、私がプロユーザー向けに500個のセット(各セット$39)を販売すべきだと判断しました。それ以上の入力を待たずに、AI は1時間14分間も独自に作業を続け、数百ものコードファイルとプロンプトを作成しました。そして、私が実行するだけで、売れ行きが怪しい架空のマーケティング主張で埋め尽くされた動作するウェブサイトを作成・デプロイし、約束された500個のプロンプトセットを販売するための単一のファイルを手渡してくれました。実際に AI が立ち上げたサイトはここで見ることができます(ただし、実際に機能して収益を集めることができた販売リンクは私が削除しました)。もし良心の呵責を無視してこれらのプロンプトパックを実際に販売していたら、約束された$1,000 を確実に得ていたと強く疑います。
Claude Code は親しみやすいインターフェースを持っているわけではありませんが、私が一度のリクエストを行ったところ、AI がそれについて私にインタビューを行い、1 時間以上も自律的に動作し、その後、私の求めたものを明確な誤りなく正確に提供してくれました。
これが Claude Code の稼働状況であり、これは過去一ヶ月ほどの間に AI に突然の能力飛躍をもたらした新しい世代の AI コーディングツールの一つです。これらの新ツールが突如として強力になった理由は、一つの画期的突破によるものではなく、二つの進歩の組み合わせによるものです。第一に、最新の AI は自律的にはるかに多くの作業を行い、特にプログラミングタスクにおいて自身の誤りの多くを自己修正する能力を持っています。第二に、AI には問題を新しい方法で解決するために使用できる「エージェント型ハネス(agentic harness)」と呼ばれるツールやアプローチが与えられています。これらの二つの要因の結果として、大手 AI 企業によって作られた最新の AI ツールにおいて大きな飛躍が生じています。

METR は、AI が 50% の信頼性で自律的に完了できるタスクの長さ(人間のプロフェッショナルが要する時間によって測定)を追跡しています。これは時間の経過とともに指数関数的に増加しており、過去数ヶ月間で大きな飛躍が見られました。これは AI の能力を測る一つの指標に過ぎませんが、他のほとんどの指標とも相関していることが示されています。
AI を実験したい私たちの多くにとって、これらの新しいツールはプログラマー向けに作られています。そして本当にそうなのです:Python コマンドやプログラミングのベストプラクティスについて理解していることを前提としており、1980 年代のコンピュータラボから出てきたようなインターフェースに包まれています。また、既存のプログラマーワークフローに組み込まれるアプローチを用いてコードを分析し、トラブルシューティングを行い、作成することを支援するように明示的に設計されています。多くの点でこれは残念なことです。なぜなら、これらのシステムは実際にはあらゆる種類の知識労働者にとって広く有用だからです。そして、それらが何ができるかを見て(そして自分自身で実験して)みることで、AI の未来について多くを学べると思います。本稿では、特に Opus 4.5 を搭載した Claude Code に焦点を当てますが、これは主要な競合他社である OpenAI の GPT-5.2 を搭載した Codex や Google の Gemini 3 を搭載した Antigravity と同様に動作します。
Claude Code が立ち上げたスタートアップ企業の例に戻りましょう。この事例は実質的に印象的でしたが、ツールが持つ能力のごく一部にしか触れていないに過ぎません。その場合、私は Claude Code をコーディングのためにのみ使用しましたが、異なるペルソナからライブサイトのユーザーテストを行い、レポートを提出するよう依頼すると、その多くのツールの一つである、私のコンピュータ上の Web ブラウザへの接続機能を実行します。Claude はブラウザの制御を引き受け、自身が作成したサイトへ移動し、人間がするようにスクロールしながら確認を行います。最初のパスではかなり楽観的なレポートを提示しましたが、AI が同調的になりがちであることを私は知っているため、より批判的な視点での報告も依頼しました。この二回目のレポートは、潜在的な問題点を的確に指摘する(そしてサイトに存在していた怪しい偽レビューを発見する)点で、より優れた成果を上げました。次のステップとして、その提案を実装するよう簡単に指示し、私からの入力を最小限に抑えながらプロセスを継続することも容易です。

マジック・トリックス
Claude Code が非常に優れている大きな理由の一つは、そのエージェント型ハネスにおいて多様なトリックを活用し、極めて賢い AI である Opus 4.5 が LLM(大規模言語モデル)が抱える多くの問題を克服できるようにしている点にあります。例えば、AI がユーザー調査を行っている際に興味深い出来事が起こりました:コンテキストウィンドウがいっぱいになってしまったのです。ご存知の通り、AI は一度に「記憶」できる情報量には限りがあります。このコンテキストウィンドウは人間の基準では非常に長い(15 万語以上)ですが、会話全体、AI が読み込むすべてのドキュメント、AI が取得するすべての画像、そして AI を導く初期システムプロンプトが含まれているため、驚くほど速く埋まってしまいます。AI に真の長期記憶はないため、コンテキストウィンドウがいっぱいになると、それ以上の情報を記憶できなくなります。単なるカジュアルな会話であればこれは大きな問題ではありませんが、ChatGPT との長い対話ではローリングコンテキストウィンドウ(逐次更新される文脈領域)が機能しており、AI は最も古い部分を常に忘却しつつも、議論の最新の部分に基づいて即興で対応することで概ね追いついています。しかし、実際の作業を行う場合、新しいコードを読み込む際に AI が一部のコードを忘れてしまうことは大きな問題となります。

職場でのコンパクション(圧縮)。
Claude Code はこの問題を異なる方法で処理します。コンテキストが尽きると、停止してこれまでの会話を「圧縮」し、停止した瞬間の正確な位置についてメモを残します。その後、コンテキストウィンドウをクリアし、Claude Code の新バージョンがそのメモを読み込んで現在の進捗を確認します。これは記憶喪失の主人公が、目覚めるたびにタトゥーを参照する映画『メメント』のようなものです。これらのメモにより、Claude は継続して作業を進めるために必要なすべてを手に入れます。これが Claude が数時間連続で動作できる理由であり、その過程で何をしているかを注意深く記録し、ソフトウェアやレポートなどの中間成果物を生成して、後で参照できるようにしているからです。
これは、AI の制限を回避するために Claude Code が使用する唯一のトリックではありません。もう一つが「スキル」の使用です。この投稿を読んでいる誰もがご存知の通り、ユーザーは AI に指示を出すためにプロンプトを入力する必要があります。これらのプロンプトは命令として機能し、AI が賢くなるにつれて、複雑なプロンプト、場合によっては百ページに及ぶ長大なプロンプトの実行も非常に得意になっています。しかし、こうした長いプロンプトはコンテキストウィンドウの多くを占有するため、適切なタイミングで AI に正しいプロンプトを与える必要があります。つまり、人間であるあなたが継続して AI に指示を出すか、AI にプロンプトを絶えず供給する複雑な自動化システムを設計する必要があります。
⟦CODE_0⟧
スキルはこの問題を解決します。これは AI が使用するタイミングを決定する指示であり、プロンプトだけでなく、タスクを完了するために必要なツールセットも含まれています。素晴らしいウェブサイトの作り方を学ぶ必要があるのでしょうか?それとも Excel スプレッドシートを作成する必要がありますか?後者の場合、Excel スキルが読み込まれ、独自の指示とツールが付属します。もう一つの映画の引用をするなら、それは『マトリックス』でネオに格闘技の指示が頭上にアップロードされ、新しいスキルを獲得する「俺はカンフーを知っている」という瞬間のようなものです。スキルを使えば、AI は必要な知識を随時切り替えることで、プロセス全体をカバーできます。例えば、ジェシー・ヴィンセント氏は興味深い無料のスキルリストを公開しており、これにより Claude Code はブレインストーミングや計画から始まり、コードテストに至るまで、必要に応じてスキルを取得しながらソフトウェア開発プロセス全体を処理できるようになります。スキルの作成は技術的に非常に簡単で、平易な言語で行われ、AI 自体がその作成を手伝うことも可能です(これについては後ほど詳しく説明します)。

これはスキルのテキストの一例で、ここでは Anthropic が公開したデザインスキル(Design Skill)です。平易な言語で記述されており、AI に判断を委ねている点に注目してください。
スキルに加えて、Claude Code は限られたコンテキストウィンドウを管理し、困難な問題を解決するために他の手段も用意しています。また、サブエージェントを作成することも可能で、これは特定の課題を解決するために別の専門的な AI を実効的に起動することを意味します。この機能は多くの面で有用です。Opus は大規模で高コストなモデルであるため、より簡単なタスクを安価で高速なモデルに引き渡すことができます。また、Claude が複数の異なるプロセスを同時に実行できるようにし、個人ではなくチームのように動作させることも可能になります。これらのモデルはそれぞれ独自のコンテキストウィンドウを持ち、非常に専門化されていることもあります。例えば、私は研究用と画像作成用の別々のサブエージェントを構築しました。メインの AI モデルは必要に応じてこれらのエージェントを「雇用」して、専門的な作業を行わせます。

また、独自のツールを作成する必要もありません。誰でもスキルやサブエージェントを共有できますし、自社の製品と AI エージェントを連携させたい企業は、「モデル・コンテキスト・プロトコル(Model Context Protocol: MCP)」と呼ばれるアプローチを用いて、あらゆる AI に指示を与えたりアクセス権限を付与したりすることが可能です。科学論文へのアクセスを AI に許可する出版社向けの MCP や、財務データの分析能力を AI に付与する決済会社向けの MCP、特定のソフトウェア製品の利用を可能にするソフトウェアプロバイダー向けの MCP などがあります。その結果、Claude Opus 4.5 のような賢い汎用 AI が、必要な時に専門スキルを即座に適用し、必要に応じてツールを使用しながら、自身の行動を追跡できる非常に柔軟なシステムが実現されます。
Claude Code が特に強力なのは、あなたのコンピュータやファイル上で動作するからです。つまり、あなたのマシンにアクセスできる人間ならほぼ何でもできる AI を持つことになります。すべてのファイルを読み込み、新しいファイルを作成できます(PowerPoint や Word も結局はコードであり、Claude はコードの書き方を知っています)、ブラウザを使ってウェブにアクセスし、プログラムを記述して実行することも可能です。もちろん、AI に欠陥がないわけではなく、ブラウザやコンピュータへのアクセス権を与えることは、あらゆる新たなリスクと危険を生み出します。AI が不要なファイルを削除したり、予期せぬ結果をもたらすコードを実行したり、ブラウザ内の機密データにアクセスしたりする可能性があります。これらの警告にもかかわらず、Claude Code について非常に簡単な紹介をさせていただきますが、必ずバックアップを作成し、専用のフォルダを使用し、失っても構わないもの以外へのアクセス権は与えないでください。
アマチュアのための Claude Code ガイド
これまでのスクリーンショットでは Claude Code のコマンドラインインターフェースを使用してきましたが、より簡単な方法があります(昨日から!)。Claude Desktop を使用すれば、こちらからダウンロードしてインストールできます(利用期間は問いませんが、少なくとも月額 20 ドルのサブスクリプションが必要です)。現在、デスクトップ版はコマンドラインインターフェースに比べて機能が少し少ないものの、アマチュアにとってはるかに使いやすいです。

AI にフォルダへのアクセス権限を与えるだけで(Claude はそのフォルダ内のファイルに対して何でも実行できるため、機密性の高い場合は特に注意し、必ずバックアップを取ってください)、AI との作業を開始できます。レポート調査や作成を依頼したり、クレジットカードの利用明細にアクセスさせてスプレッドシートに入力させ、異常がないか報告させたり、データ可視化を行わせたり、その他好きなことをさせることができます。私が以前紹介した最も強力なオプションは、「/」で始まるスラッシュコマンドを通じて利用できます。「/agents」と入力するとサブエージェントを設定でき、「/skills」と入力するとスキルを作成またはダウンロードできます(デスクトップ版では使用可能なスラッシュコマンドが限られていますが、将来的には全機能が利用可能になります)。Claude Code の活用方法は多岐にわたるため、ご自身に適した方法を見つけるために試行錯誤してみてください。ただし、プログラマーでなくても実際にコーディングに使うことを強くお勧めします。
例えば、この文章を書いている間も、私は時々 Claude Code のウィンドウを開き、AI に楽しみのためにゲームを作らせていました。それは文明が興亡し、独自の言語や文化、経済を発展させる歴史のシミュレーションです。数分ごとに、私は AI にさらに不可能と思われるリクエストを与えました:世界に独自のプレートテクトニクスと気象システムを持たせること、支配者の家系図を追跡すること、出来事を劇的に要約する AI を組み込むことなど。変更のたびに、AI は結果をプレイテストし、ゲームの新しいバージョンを作成しました。以前の「バイブコーディング」の経験とは異なり、AI が立ち止まったりループしたりすることはなく、すべてがスムーズに進みました。以下の動画をご覧ください。有能なプログラマーならすぐに気づくような問題点も含まれているでしょうが、結果はここからダウンロードできます(その部分も AI が処理しました)。
これらは何を意味しているのでしょうか?あなたがプログラマーであれば、すでにこれらのツールを探求すべきです。プログラミングに隣接する立場の方(データを取り扱う学者、コードで実験したいデザイナー、自分が想像する何かを作りたいと願る誰でも)にとって、これは実験をする絶好の機会です。しかし、ここにはより深い意義があります:適切な環境さえあれば、今日の AI は実際に意味のある、持続的な作業を遂行する能力を持っており、それが結果として、私たちがタスクに取り組む方法を変え始めています。
驚くべきことに、それはプログラミングから始まっています。AI 界で最も有名なプログラマーの一人であるアンドレイ・カルパティ(Andrej Karpathy)は最近、「プログラマーとしてこれほど取り残されたと感じたことはありません。プログラマーが貢献する部分がますます希薄になり、その隙間を埋める形へと劇的にリファクタリングされているのです。過去約 1 年間で利用可能になったものを適切に繋ぎ合わせさえすれば、私は 10 倍の力を発揮できるという感覚があります。しかし、この強化を享受できないのは明らかにスキル不足によるものです」と投稿しました。現在の Claude Code の不慣れさや、コーディングへの特化という点に惑わされないでください。AI を他の知識タスクで活用するための新しい基盤(harnesses)が間もなく登場し、それらがもたらす変化もまた現れます。
購読する
共有する

原文を表示
I opened Claude Code and gave it the command: “Develop a web-based or software-based startup idea that will make me $1000 a month where you do all the work by generating the idea and implementing it. i shouldn’t have to do anything at all except run some program you give me once. it shouldn’t require any coding knowledge on my part, so make sure everything works well.” The AI asked me three multiple choice questions and decided that I should be selling sets of 500 prompts for professional users for $39. Without any further input, it then worked independently… FOR AN HOUR AND FOURTEEN MINUTES creating hundreds of code files and prompts. And then it gave me a single file to run that created and deployed a working website (filled with very sketchy fake marketing claims) that sold the promised 500 prompt set. You can actually see the site it launched here, though I removed the sales link, which did actually work and would have collected money. I strongly suspect that if I ignored my conscience and actually sold these prompt packs, I would make the promised $1,000.

Claude Code does not have a friendly interface, but you can see how I made a single request, the AI interviewed me about it, it worked for over an hour independently, and then gave me exactly what I asked for, without any discernible errors.
This is Claude Code at work, one of a new generation of AI coding tools that represent a sudden capability leap in AI in the past month or so. What makes these new tools suddenly powerful is not one breakthrough, but a combination of two advances. First, the latest AIs are capable of doing far more work autonomously while self-correcting many of their errors, especially in programming tasks. Second, the AIs are being given an “agentic harness” of tools and approaches that they can use to solve problems in new ways. The result of these two factors has led to big leaps in the latest AI tools made by the big AI companies.

METR tracks the length of tasks (measured by how long they take human professionals) that AI can complete autonomously with 50% reliability. It has been increasing exponentially over time, with large leaps in the past few months. This is just one measure of AI ability, but it does correlate with most other measures as well.
Unfortunately for most of us who want to experiment with AI, these new tools are built for programmers. And I mean they are really built for programmers: they assume that you understand Python commands and programming best practices and they are wrapped in interfaces that look like something from a 1980s computer lab. They are also explicitly designed to help analyze, troubleshoot, and write code using approaches that fit into existing programmer workflows. In a lot of ways, this is a shame, because these systems are actually broadly useful to knowledge workers of all types, and, by seeing what they can do (and experimenting with them yourself), I think you can learn a lot about the future of AI. In this post, we are going to focus on one in particular, Claude Code powered by Opus 4.5, but it works similarly to its main competition OpenAI’s Codex with GPT-5.2 and Google’s Antigravity with Gemini 3.
To return to the example of the startup company launched by Claude Code, as practically impressive as this was, it was only touching a small part of the capabilities of what the tool is capable of. In that case, I only used Claude Code for coding, but if I ask it to do user testing of the live site from different personas and give me a report, it deploys one of its many tools, its connection to the web browser on my computer. Claude takes control of the browser and goes to the site it created, scrolling through it like a human would. On the first pass, it gave me a pretty optimistic report, but, because I know that AIs tend to be sycophantic, I also asked it for a more critical one. This second report did a better job nailing potential issues (and spotting the sketchy fake reviews that were on the site). As a next step, I could easily ask it to implement its suggestions, continuing the process with minimal input from me.

The Magic Tricks
A big reason Claude Code is so good is that it uses a wide variety of tricks in its agentic harness that allow its very smart AI, Opus 4.5, to overcome many of the problems of LLMs. For example, an interesting thing happened while the AI was doing its user research: its context window filled up. As you might know, AIs can only “remember” so much information at a time. This context window is often quite long by human standards (150,000 words or more) but it gets filled up remarkably quickly because it contains your entire conversation, every document the AI reads, every image it takes, and the initial system prompts that help guide the AI. There is no real long-term memory for AI, so as soon as the context window fills up, the AI cannot remember anything else. If you are just having a casual chat, this isn’t really a problem. Any long conversation with ChatGPT features a rolling context window, the AI is constantly forgetting the oldest part of its conversation, but it is generally able to keep up by improvising based on the most recent parts of the discussion. If you are doing real work, however, having the AI forget some of your code as it reads new code becomes a big problem.

Compacting at work.
Claude Code handles this issue in a different way. When it runs out of context, it stops and “compacts” the conversation so far, taking notes about exactly where it was when it stopped. Then it clears its context window, and the fresh version of Claude Code reads the notes and reviews the progress to date - think of the amnesiac main character from the movie Memento looking at his tattoos for reference whenever he wakes up with no memory. These notes give Claude everything it needs to keep moving. This is why Claude can run for hours at a time, it carefully notes what it is doing along the way, and produces interim work, like pieces of software and reports, that it can refer to.
This is not the only trick Claude Code uses to get around the limitations of AI. Another is its use of Skills. As everyone reading this post knows, users have to prompt AIs to do things. These prompts act as instructions, and, as AIs have gotten smarter, they have become much better at executing complex prompts, even hundred page long prompts. These long prompts take up a lot of the context window, however, and require a giving the AI the right prompt at the right time. That either means that you, as a human, have to keep prompting the AI or you have to design a complex automated system that keeps feeding the AI prompts.
Skills solve this problem. They are instructions that the AI decides when to use, and they contain not just prompts, but also the sets of tools the AI needs to accomplish a task. Does it need to know how to build a great website? It loads up the Website Creator Skill which explains how to build a website and the tools to use when doing it. Does it need to build an Excel spreadsheet? It loads the Excel skill with its own instructions and tools. To make another movie reference, it is like when Neo in the Matrix gets martial arts instructions uploaded to his head and acquires a new skill: “I know kung fu.” Skills can let an AI cover an entire process by swapping out knowledge as needed. For example, Jesse Vincent released an interesting free list of skills that let Claude Code handle a full software development process, picking up skills as needed, starting with brainstorming and planning before progressing all the way to testing code. Skill creation is technically very easy, it is done in plain language, and the AI can actually help you create them (more on this in a bit).

An example of the text of a skill, in this case the Design Skill released by Anthropic. Notice how it is written in plain language and trusts the AI to make decisions.
Along with Skills, Claude Code has other tricks up its sleeve to manage its limited context window and solve hard problems. It can also create subagents - effectively launching other, specialized AIs to solve specific problems. This can be useful in many ways. Because Opus is a large, expensive model, it can hand off easier tasks to cheaper and faster models. It also allows Claude to run many different processes at once, making it work like a team, rather than an individual. And these models can be very specialized with their own context windows. For example, I built separate subagents for research and for image creation. The main AI model “hires” these agents when needed to do specialized work.

And you don’t even need to create your own tools. Anyone can share Skills or subagents, and companies who want AI agents to work with their products can use an approach called the Model Context Protocol (MCP) to give any AI instructions and access. There are MCPs from publishers that let AI access scientific papers for research, MCPs from payment companies that give the AI the ability to analyze financial data, MCPs from software providers that let AI use a particular software product, and so on. The result is a very flexible system where a smart generalist AI like Claude Opus 4.5 can apply specialized skills on the fly, use tools as needed, and keep track of what it is doing.
Claude Code is particularly powerful because it works on your computer and your files. So now you have an AI that can do almost anything a human with a access to your machine can do. It can read all your files and create new ones (PowerPoint and Word are just code, in the end, and Claude knows how to write code), access the web using your browser, write and execute programs for you, and more. Of course, AIs are not flawless and giving an AI access to your browser and computer creates all sorts of new risks and dangers. The AI might delete files it shouldn't, execute code with unintended consequences, or access sensitive data in your browser. Despite these warnings, I am going to give you a very quick intro to Claude Code, but make backups, use a dedicated folder, and don't give it access to anything you can't afford to lose.
An Amateur’s Guide to Claude Code
Though I have been using the Command Line Interface for Claude Code in the screenshots so far, there is an easier way (as of yesterday!) to access Claude Code. You can do this with Claude Desktop, which you can download and install here (using it for any length of time requires at least a $20 monthly subscription). Right now, the Desktop version has a few less features than the Command Line Interface, but it is much easier for amateurs to use.

Now just give the AI access to a folder (remember that Claude can do anything to the files in that folder, so be careful if it is sensitive and make a backup) and you can start working with the AI: have it research and write reports, give it access to your credit card records so it can put them into a spreadsheet and tell you about any anomalies, ask it to do a data visualization, or whatever else you like. The most powerful options I mentioned earlier are accessed through slash commands that start with a “/” — typing /agents lets you set up subagents, /skills lets you create or download skills, and so on (the desktop version has limited slash commands, but the full set is coming). There are many ways people are using Claude Code, so you can experiment to figure out what works for you, but I would also suggest using it to actually code, even if you aren’t a coder.
For example, while I was writing this piece, I would occasionally go to a Claude Code window where I had the AI building a game for me for fun: a simulation of history where civilizations rise and fall, developing their own languages, cultures, and economies. Every few minutes, I would give the AI another seemingly impossible request: make sure the world has its own plate tectonics and weather; keep track of the family trees of rulers; build in an AI that dramatically summarizes events and so on. After each change, the AI would playtest the results and produce a new version of the game. Unlike previous vibe coding experiences, the AI never got stuck or went in circles, it all went smoothly. Take a look at the video below. It is, I am sure, filled with issues that a competent coder would catch, but you can download the results here (the AI handled that part, too).
What does all this mean? If you're a programmer, you should already be exploring these tools. If you're programming-adjacent (an academic who works with data, a designer who wants to experiment with code, anyone who wants to try building a thing they are imagining) this is your moment to experiment. But there's a deeper point here: with the right harness, today's AIs are capable of real, sustained work that actually matters, and that, in turn, is starting to change how we approach tasks.
It is starting, unsurprisingly, with programming. One of the more famous coders in the AI world, Andrej Karpathy, recently posted: “I've never felt this much behind as a programmer. The profession is being dramatically refactored as the bits contributed by the programmer are increasingly sparse and between. I have a sense that I could be 10X more powerful if I just properly string together what has become available over the last ~year and a failure to claim the boost feels decidedly like skill issue.” Don’t let the awkwardness of the current Claude Code or its specialization for coding fool you. New harnesses that make AI work for other knowledge tasks are coming in the near future, and so are the changes that they will bring.
Subscribe now
Share

関連記事
Anthropic の Fable 5 はワンクリックで奇妙に面白いビデオゲームを生成可能
AI 企業 Anthropic が発表した「Fable 5」は、ユーザーがボタンを1回押すだけで、独自の世界観を持つ面白おかしいビデオゲームを自動生成する機能を備えている。
Anthropic や OpenAI は、ユーザーが支払う 100 ドルあたり 1,000 ドル以上を費やしている可能性がある(39 分読了)
TLDR AI は、LLM を活用したコーディングがすぐに安価になる見込みはないと指摘し、現在の利用はサブスクリプションの大幅な補助によるものだと説明しています。API を使用した本格的なユースケースではコストが高騰しており、開発者は費用増への備えとしてより堅牢なシステムの構築を準備する必要があるとしています。
コード参照ハッチの防御(GitHub リポジトリ)
Anthropic は、Claude を用いた自律的な脆弱性発見と修正のためのリファレンス実装を GitHub に公開し、一般ベストプラクティスに基づくカスタムパイプライン構築を可能にした。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み