AIエージェントコーディングに懐疑的な人物が詳細に試してみた
AIコーディングエージェントの懐疑論者であるMax Woolfが、YouTubeメタデータスクレイパーからscikit-learnのRust移植という野心的なプロジェクトまでを試し、2025年11月以降のモデルの飛躍的進化を実証した詳細な体験記をSimon Willisonが紹介している。
キーポイント
懐疑論者による実証的検証
AIコーディングエージェントに懐疑的だったMax Woolfが、実際に複数のプロジェクトでテストを行い、その能力の飛躍的進化を実証した。
2025年11月の技術的転換点
Opus 4.6/Codex 5.3などのモデルが、わずか数ヶ月前のコーディングLLMよりも桁違いに優れており、2025年11月が重要な技術的転換点となったことが示されている。
野心的な実用プロジェクトの成功
単純なスクレイパーから、Pythonのscikit-learnをRustに移植するという高度なプロジェクトまで、AIエージェントが実際に機能するコードを生成できることを実証した。
コミュニケーションの難しさ
このような技術的進歩の大きさを、懐疑的な聴衆に伝えることの難しさが指摘されており、AIハイプと実際の進歩の区別が課題となっている。
影響分析・編集コメントを表示
影響分析
この記事は、AIコーディングエージェントの現実的な能力を懐疑的立場から検証した貴重な証言であり、2025年11月という技術的転換点の重要性を裏付けている。開発者コミュニティにおけるAI支援プログラミングの受容と実用化を加速させる可能性があり、ソフトウェア開発プロセスの根本的な変化を示唆している。
編集コメント
懐疑論者による実証的検証というアプローチが説得力を持ち、AIコーディング技術の現実的な進歩を伝える良質なコンテンツ。技術的ハイプと実際の進歩の区別についての指摘は、業界全体にとって重要な視点を提供している。
AI エージェントによるコーディングに懐疑的な人物が、過度に詳細にその試行を行う
「11 月にコーディングエージェントが劇的に向上した」というジャンルの記事の最新作で、Max Woolf 氏によるものです。ぜひお読みいただく価値があります。氏は、それぞれ前例よりも野心的な一連のコーディングエージェントプロジェクトを記述しています。最初は単純な YouTube メタデータスクレイパーから始まり、最終的には以下のようなものへと進化します。
Python の scikit-learn(データサイエンスおよび機械学習ライブラリのゴールドスタンダード)のすべての機能を備えたまま Rust へ移植することは傲慢な行為であると言えるでしょう。
しかし、それは皮肉でもなく非常に良いアイデアなので、私は試してみることにしました。エージェントを活用することで、現在「rustlearn」(極端なプレースホルダー名)という Rust クレートを開発中です。このクレートは、ロジスティック回帰や k-means クラスタリング といった標準的な機械学習アルゴリズムの高速実装を実装するだけでなく、上記のアルゴリズムの高速実装も備えています。私が前述した 3 ステップのパイプラインは、より単純なアルゴリズムであっても scikit-learn の実装を上回るために機能し続けています。
Max はまた、懐疑的な既存の聴衆に対してモデルがいかに優秀になったかを説明しようとする際のフラストレーションも捉えています。
Opus 4.6/Codex 5.3 の最も厄介な点は、"Opus 4.5(およびその後に登場したモデル)は、数ヶ月前にリリースされたコーディング用大規模言語モデルよりも桁違いに優れている"と公言することが不可能だということだ。そう言うと、AI 過熱を煽るクリックベイト記事の書き手だと見なされてしまうからだ。しかし、これは私の個人的なフラストレーションに対する逆説的な真実である。私はコーディングの経歴を持つ私自身でも数ヶ月かかるような複雑なタスクを与えてこの厄介なモデルを打ち破ろうと試みてきたが、Opus と Codex はそれを次々と正しく実行し続ける。
この記事での些細な一言がきっかけで、Claude Code に Rust 製のワードクラウド CLI ツールの構築を依頼したところ、快く引き受けて実現してくれた。
Tags: ai, max-woolf, generative-ai, llms, ai-assisted-programming, coding-agents, agentic-engineering, november-2025-inflection
原文を表示
An AI agent coding skeptic tries AI agent coding, in excessive detail
Another in the genre of "OK, coding agents got good in November" posts, this one is by Max Woolf and is very much worth your time. He describes a sequence of coding agent projects, each more ambitious than the last - starting with simple YouTube metadata scrapers and eventually evolving to this:
It would be arrogant to port Python's scikit-learn — the gold standard of data science and machine learning libraries — to Rust with all the features that implies.
But that's unironically a good idea so I decided to try and do it anyways. With the use of agents, I am now developing rustlearn (extreme placeholder name), a Rust crate that implements not only the fast implementations of the standard machine learning algorithms such as logistic regression and k-means clustering, but also includes the fast implementations of the algorithms above: the same three step pipeline I describe above still works even with the more simple algorithms to beat scikit-learn's implementations.
Max also captures the frustration of trying to explain how good the models have got to an existing skeptical audience:
The real annoying thing about Opus 4.6/Codex 5.3 is that it’s impossible to publicly say “Opus 4.5 (and the models that came after it) are an order of magnitude better than coding LLMs released just months before it” without sounding like an AI hype booster clickbaiting, but it’s the counterintuitive truth to my personal frustration. I have been trying to break this damn model by giving it complex tasks that would take me months to do by myself despite my coding pedigree but Opus and Codex keep doing them correctly.
A throwaway remark in this post inspired me to ask Claude Code to build a Rust word cloud CLI tool, which it happily did.
Tags: ai, max-woolf, generative-ai, llms, ai-assisted-programming, coding-agents, agentic-engineering, november-2025-inflection
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み