Anthropic の Mythos が Firefox のサイバーセキュリティ対策を再構築
Anthropic の新モデル「Mythos」が Firefox のセキュリティ監査に導入され、10 年以上放置されていた深刻な脆弱性を含む数千件のバグを発見したことで、AI によるソフトウェアセキュリティの質的転換が実証された。
キーポイント
Mythos による大規模脆弱性の発見
Anthropic の新モデル「Mythos」は Firefox コードを分析し、10 年以上も放置されていた深刻なバグを含む数千件の高重大度脆弱性を特定した。
AI ツールの質的転換と自己評価機能
従来の AI ツールが抱えていた偽陽性の多さが解消され、特に「エージェント型システム」が自身の作業を評価・フィルタリングする能力により、信頼性が劇的に向上した。
セキュリティ運用プロセスの再構築
Mozilla は Mythos の導入により、数ヶ月でセキュリティ調査のダイナミクスを根本から変え、AI モデルの活用技術も大幅に改善したと報告している。
脆弱性修正数の劇的な増加
2026年4月のFirefoxのバグ修正数は前年同期比で31件から423件へと急増し、セキュリティ対応が大幅に強化されたことを示している。
長年の欠陥を含む多様な脆弱性の特定
研究者らはサンドボックスの異常な脆弱性や、HTML要素の解析における15年前からのエラーなど、深刻なバグの詳細を12件公開した。
セキュリティ品質の業界全体での向上確認
Mozillaのエンジニアは、内部スキャンや外部報告を含むあらゆる指標において、ブラウザのセキュリティ品質が突如として非常に高まったと評価している。
AIによるサンドボックス脆弱性の発見能力
AnthropicのMythosは、複雑な攻撃パッチを作成してFirefoxのサンドボックスを攻撃するプロセスを通じて、人間研究者よりも多くの脆弱性を発見している。
影響分析・編集コメントを表示
影響分析
この記事は、AI が単なるバグ発見ツールを超え、コードの文脈を理解し自己検証を行う「自律的なセキュリティパートナー」として機能し始めたことを示唆しています。特に、長年の暗黙知や放置された脆弱性を発掘できる点は、ソフトウェアのライフサイクル全体におけるリスク管理のパラダイムシフトを意味しており、今後他の主要なオープンソースプロジェクトでも同様の導入が加速すると予想されます。
編集コメント
AI セキュリティツールの「偽陽性」問題が解消され、実戦レベルで信頼を得た事例は極めて貴重です。これは単なるツール性能の向上ではなく、開発プロセスそのものの再定義を迫る転換点と言えます。
Anthropic が今年 4 月に新しい Mythos モデルを発表した際、ソフトウェアを開発するすべての人に対して厳しい警告も同時に伝えられました。このモデルはソフトウェアの脆弱性を嗅ぎ出す能力が極めて高く、同研究所は主張しています、公開する前に修正が必要な数千件の深刻なバグを発見したということです。
現在、Mozilla の Firefox ブラウザを担当するセキュリティ研究者たちが、このプロセスが実際にどのように進行してきたか、そして Mythos の能力がソフトウェア全体のセキュリティに何を意味するのかについて、より詳細な洞察を提供しています。
木曜日に公開された記事で Mozilla は、Mythos が過去 10 年以上もコード内に眠っていたものを含む、多くの深刻なバグを発見したと述べています。
これは、AI を活用したセキュリティツールが 6 ヶ月前まで果たし得ていた能力と比較すると、著しい進歩です。これまで AI ベースのバグ発見ツールには重大な欠点があり、セキュリティチームに低品質なレポートや誤検知を浴びせることが多々ありました。しかし Mozilla の研究者たちは、最新のツールは局面を変えたと指摘しています。特に、自律型システム(アジェンティック・システム)が自身の作業を評価し、不適切な結果をフィルタリングできるようになった今ではなおさらです。
「このダイナミクスが数ヶ月という短い期間で私たちにどれほど変化をもたらしたか、過大評価することは難しい」と研究者たちは記述している。「第一に、モデルの能力は大幅に向上した。第二に、これらのモデルを*活用する*ための技術を劇的に改善した。」
image画像クレジット: Firefox
その結果は目を見張るものがある:2026 年 4 月、Firefox は 423 のバグ修正をリリースしたが、ちょうど 1 年前の同じ時期にはわずか 31 件しかなかった。研究者たちはまた、12 のバグに関する詳細も公開している。これらは、珍しいサンドボックス脆弱性のペアから、ブラウザが HTML 要素を解析する際の 15 年前の誤りまで多岐にわたる。
「これらの技術は実際、突如として非常に優れたものになった」と、Mozilla のフェローエンジニアであるブライアン・グリンスター氏は TechCrunch に語った。「社内スキャンでも確認できているし、外部からのバグ報告でもそうだし、業界全体で見られるあらゆるシグナルでもその傾向が読み取れる。」
Techcrunch イベント
サンフランシスコ、カリフォルニア州
| 2026 年 10 月 13-15 日
Firefox の「サンドボックス」システムに脆弱性があることを明らかにする上で、このシステムが果たした役割は特に印象的です。なぜなら、それを悪用する攻撃には極めて複雑な手順が必要となるからです。サンドボックスの脆弱性を発見するためには、モデルはブラウザ用の改ざんされたパッチを作成し、その新しいコードを実装してソフトウェアの中で最も安全な部分を攻撃する必要があります。バグの発見と実証は繊細で多段階のプロセスであり、創造力と細心の注意の両方が求められます。
この状況を文脈化すると、Mozilla のバグ報奨金プログラムでは、Firefox のサンドボックスにバグを発見した研究者に対して最大 20,000 ドル(利用可能な最高額の報酬)が支払われます。しかし、最高額の報酬があるにもかかわらず、Grinstead 氏は Mythos が人間のリサーチャーよりもはるかに多くのサンドボックス関連の問題を見つけていると述べています。「確かに私たちはそれらを受け取っていますが、この手法で発見できる量には及びません」と彼は TechCrunch に語りました。
注目すべきは、AI コーディングツールの進歩が文書化されているにもかかわらず、Firefox チームはまだ AI を使ってバグを修正していないことです。チームは各バグに対してパッチ作成を AI に依頼しますが、生成されたコードは通常直接デプロイできず、人間のエンジニアのためのモデルとして機能します。
「この投稿で議論しているバグについては、すべてが 1 人のエンジニアによるパッチ作成と、別の 1 人のエンジニアによるレビューという形です」と Grinstead 氏は述べています。「自動化可能であるとは見出せていません。」
AI の新たな能力がサイバーセキュリティにおけるより広範なパワーバランスをどのように変化させるかは、まだ明確ではありません。Mythos がプレビューされてから 1 ヶ月が経過しましたが、発見されたバグの多くはまだパッチが適用されていない可能性が高く、その影響範囲全体を把握するのは困難です。Anthropic は責任ある開示の規範に従うことに厳格ですが、悪意のある行為者たちが裏側で同様の手法を利用している可能性は高く、彼らが使用しているモデルが Anthropic のものほど完璧でなくても、それは変わりません。
最近のイベントで講演した Anthropic の CEO、ダリオ・アモダイは、新しいツールが最終的には防衛側に有利に働くと楽観的な見解を示しました。「この問題を適切に処理できれば、私たちは出発点よりも良い立場になれるはずです。なぜなら、これらのバグをすべて修正したからです。見つかるべきバグには限りがあるのです」とアモダイ氏は述べています。「したがって、この課題の向こう側にはより良い世界が待っていると私は考えています」。
細部にわたる作業に取り組んだグリンスターは、より慎重な見解を示しています。「これは攻撃者にも防衛者にも有用ですが、ツールが利用可能になることで、わずかに防衛側に有利に傾きます。現実問題として、誰もまだこれに対する確実な答えを知っているわけではありません」。
*当記事内のリンクを通じてご購入いただいた場合、私たちは少額のコミッションを獲得する可能性があります。これは当社の編集の独立性には影響しません。*
ラッセル・ブランドムは 2012 年以来、プラットフォーム政策と新興技術に焦点を当てながらテクノロジー業界の報道を行ってきました。以前は The Verge や Rest of World で勤務し、Wired、The Awl、MIT の Technology Review にも寄稿しています。
彼への連絡先は russell.brandom@techcrunch.com または Signal(412-401-5489)です。
原文を表示
When Anthropic unveiled its new Mythos model in April, it also delivered a stern warning to anyone developing software. The model was so powerful at sniffing out software vulnerabilities, the lab claimed, that it had discovered thousands of high-severity bugs that would need to be fixed before it could be made public.
Now, security researchers for Mozilla’s Firefox browser are providing a closer look at what that process has looked like in practice, and what Mythos’ powers mean for software security at large.
In a post published on Thursday, Mozilla said Mythos has unearthed a wealth of high-severity bugs, including some that had lain dormant in the code for more than a decade.
That’s a significant improvement from what AI security tools were capable of even six months ago. Until now, AI bug-finding tools have come with severe drawbacks, often inundating security teams with low-quality reports and false positives. But Mozilla’s researchers say the latest generation of tools have turned a corner, particularly now that agentic systems can assess their own work and filter out bad results.
“It is difficult to overstate how much this dynamic changed for us over a few short months,” the researchers wrote. “First, the models got a lot more capable. Second, we dramatically improved our techniques for *harnessing* these models.”

The results are striking: In April 2026, Firefox shipped 423 bug fixes, compared to just 31 exactly a year earlier. The researchers have also published details on 12 of the bugs, which range from a pair of unusual sandbox vulnerabilities, to a 15-year-old error in how the browser parses an HTML element.
“These things are actually just suddenly very good,” Brian Grinstead, a distinguished engineer at Mozilla, told TechCrunch. “We see that on our own internal scanning, we see that on external bug reports, and we see that in all sorts of signals across the industry.”
Techcrunch event
San Francisco, CA
|
October 13-15, 2026
The fact that the system helped reveal vulnerabilities in Firefox’s “sandbox” system is particularly impressive, given how intricate an attack that exploits it needs to be. To find sandbox vulnerabilities, the model must write a compromised patch for the browser, then attack the most secure part of the software with the new code implemented. Finding and demonstrating the bug is a delicate, multi-step process, requiring both creativity and close attention.
To put this into context, Mozilla’s bug bounty program pays researchers who can find a bug in Firefox’s sandbox up to $20,000 — the highest reward available. Despite the top-dollar bounty, however, Grinstead says Mythos is finding more sandbox issues than human researchers ever did. “We do get them,” he told TechCrunch, “but not at the volume that we are able to find with this technique.”
Notably, the Firefox team still isn’t using AI to fix the bugs, despite well-documented progress in AI coding tools. The team does ask AI to code up patches for each bug, but the resulting code usually can’t be deployed directly, and instead serves as a model for a human engineer.
“For the bugs we’re talking about in this post, every single one is one engineer writing a patch and one engineer reviewing it,” Grinstead says. “We have not found it to be automatable.”
It’s still not clear how AI’s emerging capabilities will change the broader balance of power in cybersecurity. One month since Mythos was previewed, most of the bugs discovered likely haven’t been patched, which makes it hard to capture the full scope of their impact. Anthropic has been scrupulous about following responsible disclosure norms, but it’s likely bad actors are using similar techniques behind the scenes, even if the models they’re using aren’t quite as good.
Speaking at a recent event, Anthropic CEO Dario Amodei was optimistic that the new tools would ultimately favor defenders. “If we handle this right, we could be in a better position than we started, because we fixed all these bugs. There are only so many bugs to find,” Amodei said. “So I think there’s a better world on the other side of this.”
Having dealt with the gritty details, Grinstead has a more measured view: “It’s useful for both attackers and defenders, but having the tool available shifts the advantage a little bit to defense. Realistically, nobody knows the answer to this yet.”
*When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.*
Russell Brandom has been covering the tech industry since 2012, with a focus on platform policy and emerging technologies. He previously worked at The Verge and Rest of World, and has written for Wired, The Awl and MIT’s Technology Review.
He can be reached at russell.brandom@techcrunch.com or on Signal at 412-401-5489.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み