Simon Willison Blog·2026年3月9日 22:37·約2分

つまらない技術ではないかもしれない

#LLM #コーディングエージェント #コンテキストウィンドウ #Agentic Engineering

TL;DR

Simon Willison氏は、最新のLLM搭載コーディングエージェントが訓練データにない新しいツールやプライベートなライブラリでも、文書と既存コードを参照して適切に動作することを実証し、「退屈な技術」選定への悪影響懸念が払拭されたとしている。

AI深層分析2026年3月9日 23:42

注目/ 5段階

深度40%

キーポイント

古い懸念の払拭

以前は訓練データに偏りがあったため、マイナーな言語やツールのサポートが劣っていたが、最新のモデルではこの傾向が見られなくなっている。

コンテキスト長の活用

新しいモデルは長いコンテキスト長を活用し、ツールのヘルプドキュメントや仕様書を事前に読み込むことで、知識不足を補っている。

エージェントの実践的動作

コーディングエージェントは既存のコードベース内の例を参照し、パターンを理解した上で自己テストと反復を行うことで、未知のライブラリでも正常に動作する。

技術選定への影響

コーディングエージェントが「退屈な技術」選定アプローチの究極形態になると予想されたが、実際には技術選択に偏りを生じさせていないという驚くべき結果が得られた。

影響分析・編集コメントを表示

影響分析

この記事は、LLMのコンテキスト窓の拡大とエージェント機能の進化が、技術スタックの多様性を維持する上で重要であることを示唆しています。開発者は、AIが既存の有名ライブラリのみを優先して学習するという懸念を抱く必要が減り、より適材適所の技術選定が可能になる可能性があります。

編集コメント

Simon Willison氏の経験則は、モデルの「知識量」だけでなく、「参照能力」と「推論プロセス」の向上を示す重要な事例です。技術選定の自由を損なわないAIツールの進化は、開発者にとって朗報と言えます。

プログラミングにおけるLLM（大規模言語モデル）に関して繰り返し指摘される懸念は、学習データ内で最も多く扱われているツールへと技術選択を偏らせ、新しく優れたツールが認知されるのを阻害するのではないか、というものです。

これは確かに数年前には当てはまっていました。当時、モデルにPythonやJavaScriptの質問をすると、よりマイナーな言語について尋ねる場合よりも、はるかに良い結果が得られるように見えたのです。

しかし、優れたコーディングエージェントの仕組みで動作する最新モデルにおいて、この傾向が続いているかどうかは疑問です。

私は、自身の真新しいツールで非常に良好な結果を得ています。その際、まず「uvx showboat --help / rodney --help / chartroom --help を使ってこれらのツールについて学んでください」とプロンプトすることから始めます。これらの新しいモデルはコンテキスト長が十分に長いため、問題に取りかかる前に大量のドキュメントを読み込むことができるのです。

学習データに含まれるには非公開すぎる、あるいは新しすぎるライブラリやツールを使った既存のコードベースに、コーディングエージェントを投入しても、私の経験上、それは全く問題なく動作します。エージェントはパターンを理解するために既存のコード例を十分に参照し、その後、反復とテストを重ねて自身の出力を調整し、不足部分を埋めていくからです。

これは驚くべき結果です。私はコーディングエージェントが「退屈な技術を選べ」というアプローチの究極の体現となるだろうと考えていました。しかし実際には、それらが私の技術選択をそのような方向に導いているようには全く見えません。

タグ: ai, generative-ai, llms, ai-assisted-programming, boring-technology, coding-agents, agentic-engineering, november-2025-inflection

原文を表示

A recurring concern I've seen regarding LLMs for programming is that they will push our technology choices towards the tools that are best represented in their training data, making it harder for new, better tools to break through the noise.

This was certainly the case a couple of years ago, when asking models for help with Python or JavaScript appeared to give much better results than questions about less widely used languages.

With the latest models running in good coding agent harnesses I'm not sure this continues to hold up.

I'm seeing excellent results with my brand new tools where I start by prompting "use uvx showboat --help / rodney --help / chartroom --help to learn about these tools" - the context length of these new models is long enough that they can consume quite a lot of documentation before they start working on a problem.

Drop a coding agent into *any* existing codebase that uses libraries and tools that are too private or too new to feature in the training data and my experience is that it works *just fine* - the agent will consult enough of the existing examples to understand patterns, then iterate and test its own output to fill in the gaps.

This is a surprising result. I thought coding agents would prove to be the ultimate embodiment of the Choose Boring Technology approach, but in practice they don't seem to be affecting my technology choices in that way at all.

Tags: ai, generative-ai, llms, ai-assisted-programming, boring-technology, coding-agents, agentic-engineering, november-2025-inflection

この記事をシェア

Simon Willison Blog重要度42026年7月3日 02:07

参加するには理解せよ：コーディングエージェントとの協働における認知負荷の課題

MarkTechPost重要度42026年7月5日 11:31

Qwen の元リーダーが「ハイブリッド思考」の誤りと、なぜ今「エージェント」を支持するのか

Simon Willison Blog2026年7月5日 10:00

sqlite-utils 4.0rc2、主にClaude Fable（約149.25ドル分）が執筆

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む