アンストロピックの魔法のようなコード検査ツール:現時点ではチェダーよりスイスチーズの方が穴が多い
Anthropicのコードセキュリティモデル「Mythos」が、人間が教えたパターン以上の発見に至らず、その限界と命名の皮肉を示す批判的分析が行われている。
キーポイント
Mythosモデルの限界
Anthropicが公開したコードセキュリティ特化AI「Mythos」は、人間が事前に教えた脆弱性パターンを検出するにとどまり、予期されたような画期的な発見能力を発揮していない。
命名の皮肉と期待外れ
'Mythos'という名称は神話的な力を示唆するが、実際には既存の知識の再確認に過ぎず、期待されたような「現実と相容れない神話的能力」ではなく、単なる信念の集合に留まっている。
AIセキュリティの現状認識
記事は、現在のAIによるコード監査ツールが人間の指導なしに未知の脆弱性を発見する能力にはまだ程遠く、過度な期待は危険であると警告している。
影響分析・編集コメントを表示
影響分析
本記事は、AIセキュリティ分野における現状の限界を指摘しており、開発者やセキュリティ専門家に対して、AIツールへの過度な依存を戒める重要な示唆を与えている。Anthropicの戦略的な命名と実際の成果のズレは、AI業界全体における「実効性対マーケティング」のバランスを考える上で参考となる。
編集コメント
AnthropicのMythosモデルが期待されたような「神話的」な発見能力を発揮せず、既存の知識の再確認に留まっている点は、現在のAIセキュリティツールの限界を示す興味深い事例です。
感想として振り返れば、それを「Mythos」と名付けたことは運命の人質にする結果を招いたと言える。Anthropic は、この名が AI コードセキュリティモデルに神話的な神々のような力があることを示唆すると期待していたのかもしれないが、別の解釈も可能だ。Mythos のもう一つの定義は、不明瞭な起源を持ち、現実と相容れない信念の集合体であるということだ。
その【現実がじわじわと持ち込まれている】(https://www.theregister.com/2026/04/22/anthropic_mythos_hype_nothingburger/) 中で、Mythos は神話的というよりはむしろ典型的な存在になりつつある。Mythos は、熟練した人間が行う多くの作業を自動化できる優れたツールであり、そこから最も恩恵を受けるのも熟練した人間である。それは人間が知っている脆弱性のクラスを見つけるのが非常に得意だが、人間が知らないものは見つけられない。訓練の賜物だろう?【Project Glasswing】(https://www.theregister.com/2026/04/07/anthropic_all_your_zerodays_are_belong_to_us/) は、早期の利用を真の必要性を持つ信頼できるパートナーに限定しており、その力を善のために使う責任あるアプローチと言えるだろう。しかし、他の制限のないモデルもこの点でかなり優れている。一部の過大評価はあるものの、真実も含まれており、LLM は LLM たる所以を全うしている。
「倫理的に運営される AI 企業が唯一の真のイノベーションだ」と言うのは皮肉すぎる。一方で、クローズドなロールアウトとそれに伴う宣伝を単なるハype(過大評価)のExercise(練習/試み)と見なすのも同様に皮肉である。これらをより良い未来の初期の兆しとして捉える方が、建設的であり、おそらくは正確であり、間違いなく興奮を伴う。それは脅威の景観が、私たちが制御できない地質的・気候学的な力の関数であること.stop being(やめ)、代わりに栽培され、制御され、そして爽快なほど地味なものになる未来である。
道を示す二つの命題がある。一つは、Mythos などのツールの有効性が継続的に進化し、より多くの構造的および個別的なコードの欠陥を明らかにし続けるということだ。もう一つは、これらのツールが必然的に一般利用可能になるということである。どれくらい早く、そして安価に実現するかは制御可能かもしれないが、結果は避けられない。IT には長期的な秘密など存在しない。
現在そして今後しばらくの間、実行されているコードの大部分は、脆弱性検出における前工業時代の産物として書かれている。AI ではなく、人間の目(Eyeballs)がその作業を行った。これは、制御不能な脆弱性探しのロボット群を放つには不適切な公的な環境である。もしそれらが早すぎたら、事態は混乱するだろう。そして、それらは確かに到来しつつある。
しかし、もし私たちがその移行を無事に乗り越えられたなら、ロボットが自由に動き回る時代が来るだろう。セキュリティリスクを一切生じないことが保証されているコードのクラスは一つだけあり、それは「デプロイされていない(未公開・未実装)コード」である。新しいコードには多くの問題があるが、デプロイ前に発見されるものもあれば、見逃されるものもある。しかし、問題の数は無限ではない。優れたツールが存在すれば、リリース前にコードを真に優れたものにしうる。その後、その同じツールが悪用する側にも利用可能になったとしても、それは問題ではない。
- AI の割り当て(クォータ)インフレは単なるお飾りではない。それはシステムに組み込まれている
- アップルのチップは新たな情勢の中核だが、その最大の勝利はWindowsである
- AI が法律という冷徹な現実とぶつかったとき、何が起こったか
- 運用システム内部にある場合、年齢確認は賢明な確認とは呼べない
よく引用される良いモデルとして、航空安全がある。ジェット機時代之初頭、新型旅客機には空中分解につながる構造的・機械的欠陥があった。時が経つにつれて、設計や素材に関する知識が向上しただけでなく、工学および規制の分野も共に進化した。現在でも墜落事故は起こるが、それらは必ずや適切に行うべきことが行われなかったことに起因するものであり、見逃すことのできないものだ。新たな未発見の故障クラスが待機しているわけではない。コードもそれとは異なるものではない可能性が極めて高い――実際、私たちがジェット機を飛ばし始めてからこれまでと同じ期間、コードも作成し続けてきたのだから。
コードの脆弱性だけを修正しても、セキュリティは完全には守られません。それは、極めて安全な航空機の製造と飛行の仕方を理解していても、燃料汚染やガンの群れ、あるいは愚かな人間のミスによって機体が損傷するのを防げないのと同じことです。ただし、それは間違いなく大きな助けになります。既知および未知の脆弱性が長い連鎖を形成して悪用される事例を見ると、コードがいかに不安定であるかがわかりますが、同時に、そのバグの1つを取り除くだけで攻撃全体を停止できることも示されています。チーズがチェダーチーズに似てくるほど、失敗のスイスチーズモデルはもはや有効ではなくなります。
コード外の穴、つまりサプライチェーンの悪用、特殊なエンジニアリング、そして単純な内部からのサボタージュ行為について言えば、それらをエンコードし、モデル化して学習できる範囲内であれば、推論エンジンの尽きない忍耐に対しても対応可能になります。そして、企業のインフラの広大な部分が古い、パッチが当てられていない、または誤設定されたシステムを稼働させ続けている間、それは「死の時代」の航空機に乗っているようなものです。決して飛行すべきではないものを停止させる権限を持つ、IT分野におけるFAA(連邦航空局)のような存在はありません。それがもし実現すれば面白い反実仮想になるでしょうが。
これもいつかは過ぎ去るだろう。百単位の脆弱性を検出するツールが、古いコードを安全にし、新しいコードをさらに安全にしないはずがない。欠陥を見つけるためのツールが、コードの内在的な強度を設計・分解・記述する技術とどのように進化していくのか、それは非常に興味深いことだろう。今の状態が最も効率的で、最も安価な方法であると誰しも期待すべきではない。また、人間の専門知識が不要になることも期待すべきではない。航空機の安全性に関する問題の多くが人間の失敗に関連しているという事実は、設計、建設、保守、そして飛行運用において、人間が依然として本質的に不可欠であることを示している。
コンピュータに得意なことをさせ、人間に得意なことをさせる。古くて真実な言葉だ。何十年ものデジタル生活から、人間がセキュリティにおいてそれほど得意ではないこと、そしてコンピュータもそうではないことが分かっている。別の古い諺があるように、「道具を与えれば、仕事は完遂できる」。しかし、Mythos はそれを可能にするツールではない。まだそうではない。一般的な AI は、むしろ状況を悪化させようとしているように見える。
今、ついに前進の道が見え、実際に起こりそうな、異なるやり方が示されている。かつて脅威の景観だったものが、良いものが育つ庭園になる可能性がある。それは神話ではない、未来だ。 ®
原文を表示
Opinion In retrospect, calling it Mythos made it a hostage to fortune. Anthropic may have hoped that the name implied its AI code security model had mythical god-like powers, but there's an alternate reading. Another definition for Mythos is a set of beliefs of obscure origin which are incompatible with reality.
That reality is trickling in, and it’s looking less mythical, more typical. Mythos is a great tool that can automate a lot of the things expert humans do, and it’s the expert humans who get the most from it. It is very good at finding classes of vulnerability that humans know about, while not finding ones that they don’t. Training, amirite? Project Glasswing, limiting early use to trusted partners with a real need, is probably a responsible approach to using its powers for good, but other unrestricted models are quite good at this too. Some hype, some truth, LLMs gonna LLM.
It is cynical to say the only real innovation is an AI company operating ethically. Equally cynical is seeing the closed roll-out and the attendant publicity as merely an exercise in hype. It is more constructive, arguably more accurate, and certainly more exciting, to take all this as an early glimpse of a better future. One where the threat landscape stops being a function of geological and climactic forces we can’t control, turning instead into one cultivated, controlled and gratifyingly anti-climactic.
Two propositions point the way. One is that the effectiveness of tools like Mythos will continue to evolve, exposing more and more structural and individual code flaws. The other, that these tools will inevitably become generally available. How quickly and cheaply may be controllable, but the outcome is inevitable. There are no long-term secrets in IT.
Right now, and for some time to come, most running code has been written in the pre-industrial age of vulnerability detection. Eyeballs, not AI balls, did the work. This is a bad public environment to dump roaming packs of implacable vuln-hunting robots. If they come too soon, it’ll be messy. And they are coming.
But if we survive that transition intact, then let the robots roam at will. There is one class of code that is guaranteed to present no security risks whatsoever, and that’s undeployed code. New code has a lot of problems, some caught before deployment and some that aren’t, but never an infinite number. Where truly excellent tools exist, code can be made truly excellent before release. It doesn’t matter if the same tools are available to the bad guys thereafter.
- AI quota inflation is no token effort. It's baked in
- Apple's chips are the core of a new landscape, but its biggest win is Windows
- What happened when AI ran into the cold hard reality of the legal profession
- Age verification isn't sage verification when it's inside operating systems
A good model, and cited often, is aviation safety. At the beginning of the jet age, new airliners had structural and mechanical faults that made them fall out of the sky. Over time, not only did design and material knowledge improve, but the engineering and regulatory disciplines evolved alongside. Now, we still have crashes, but they are inevitably traceable to things that could and should be done right, but weren't. There’s no new undiscovered class of failure waiting in the wings. It is highly unlikely that code is anything different — after all, we’ve been doing it precisely as long as we’ve been flying jets.
Just fixing code vulnerabilities doesn’t fix security, in the same way that knowing how to make and fly exquisitely safe aircraft stops fuel contamination, flocks of geese, or foolish humans from creasing the things. It does help immensely, though. Looking at exploits based on long chains of known and unknown vulns shows how flakey code can be, but it also shows how removing just one of those bugs shuts down the entire attack. The Swiss cheese model of failure works less and less well the more the cheese tends to cheddar.
As for the holes outside the code, the supply chain exploits, the special engineering, the straightforward inside sabotage job, to the extent that we can encode, model and train on them, they too will be amenable to the inexhaustible patience of the inference engines. And while huge swathes of enterprise infrastructure continue to run old, unpatched or misconfigured systems, it’ll be like flying on aircraft from the Age of Death. There’s no IT equivalent of the FAA with the power to ground that which should never be flying, much as that would be a fun counter-factual.
This too shall pass. There is no way that a tool which catches vulnerabilities by the hundred does not make old code safer, new code so much more so. It will be most interesting to see how the tools for finding flaws evolve alongside the techniques for designing, factoring and writing code for inherent strength. Nobody should expect the way things are now to be the most efficient, least expensive way there is. Nor should anyone expect human expertise to fall out of use. The fact that so many aviation safety issues revolve around human failure shows how intrinsic humans still are in design, construction, maintenance and operation aloft.
Let computers do what computers are good at, let humans do what humans are good at. Old but true. We know from decades of digital life that humans aren’t so good at security, and that computers aren’t so hot at it either. In another old saying — give us the tools and we can finish the job. Mythos isn’t a tool that can let us do that, not yet. AI in general seems determined to make things worse.
Now, at last, we can see a path forward, a different way of doing things that is likely to actually happen. What was a threat landscape can become a garden where good things grow. That’s no myth, that’s the future. ®
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み