顧客に対して先端的なモデルを安全にリリースする
AWS は、セキュリティリスクと防御能力のバランスを考慮し、Anthropic の最新モデル「Claude Fable 5」および「Mythos」クラスを、厳格なガードレール付きで Bedrock で提供開始すると発表した。
キーポイント
セキュリティと利便性の両立
AWS は顧客が最新モデルに迅速にアクセスできることを重視しつつ、インターネットや社会全体への責任として、悪用を防ぐための強力なガードレールを実装した上でリリースを行った。
プロジェクト・グラスウィングの成果
Anthropic や他社パートナーとの「Project Glasswing」での協力により、敵対的な深層脆弱性調査を防ぐことを最優先とした新しいガードレールが整備された。
防御側の活用促進
サイバーセキュリティ分野で強力な能力を持つ最新モデルを、防衛側(defenders)に提供することで、社会全体のシステムセキュリティを向上させる狙いがある。
影響分析・編集コメントを表示
影響分析
この発表は、最先端 AI モデルの公開において、単なる機能提供ではなく「社会的責任」と「セキュリティリスク管理」が同等に重要視される時代に入ったことを示しています。特に、敵対的な脆弱性調査へのアクセスを意図的に制限するガードレールの強化は、AI エコシステム全体のガバナンス基準を引き上げる重要な転換点となるでしょう。
編集コメント
最新モデルの公開を急ぐ顧客ニーズと、社会全体のセキュリティを守る責任の間で、業界全体が協力して新たな基準(ガードレール)を構築しようとする姿勢が際立っています。
AWS があらゆるワークロードを実行する上で最も安全な場所となることを目指しており、その支援の一環として、20 年以上前に AWS が設立されて以来、サービス全体にセキュリティへの深い投資を続けてきました。Amazon Bedrock に代表される当社の AI サービスも、この基盤の上に構築され、同じく重点的な取り組みのもとで提供されています。Bedrock は、顧客に対して世界最高水準のパフォーマンス、セキュリティ、プライバシーを提供するとともに、どこでも利用可能な最も広範なモデルの選択肢を備えています。昨年には、業界をリードするプライバシー保護とモデル重みへの保護機能を備えた「Bedrock Mantle」を発表しました。顧客からは、リリースされた最新のモデルにできるだけ早くアクセスしたいという要望を頻繁に伺っており、Bedrock はそれに応えるとともに、AWS に対して顧客が期待するエンタープライズ機能も提供しています。明日から Bedrock で Anthropic の Claude Fable 5 モデルが再び利用可能になること、また、誤用を防ぐためのガードレールがさらに強化されていることを大変嬉しく思います。
モデルをリリースする際、私たちは顧客に対する責任だけでなく、インターネット全体および社会全体に対する責任も考慮します。Anthropic の Claude Mythos などの最新のフロンティアモデルは、特にサイバーセキュリティの分野において強力な新機能を備えています。Project Glasswing の一部として、私たちはこれを firsthand に体験しており、Mythos クラスのモデルを防衛者の手に届けることを熱望しています。防衛者として、私たちはこれらのモデルを使用して、私たちがすべてに依存するシステムを実質的により安全にする機会を持っています。しかし、その一方で、企業、政府、学術機関が自らの資産を保護する機会を与えることなく、敵対者に意味のある高度な可視性と能力を与えてしまうことのないよう確保しなければなりません。このバランスを取ることが広範なモデルリリースにおける重要な課題であり、そのため私たちは Anthropic や他の業界パートナーと Project Glasswing で緊密に協力し、この新しいクラスのモデルのためのガードレールを洗練させてきました。私たちが皆一致して合意しているのは、敵対者が深い脆弱性調査を行う能力へのアクセスを得ることを防ぐことが、これらのガードレールにとって最も重要な目標であるということです。
これは AI にとってもエキサイティングな時期であり、新しい機能がほぼ毎日提供されています。これらの高度なモデルの機能を、セキュリティリスクを生み出すことなく多くの恩恵を得られるよう、すべての顧客に対して安全でプライバシーを保護する環境で利用可能にすることが極めて重要であると私たちは考えています。現在のガードレールがどの程度機能しているかをより深く理解し、新たなモデルがリリースされるにつれて、新しいガードレールの開発も継続して行うことが重要です。私たちはパートナーと共にイテレーションを続け、より多くの価値を提供するとともに、業界の変化にも柔軟に対応していく所存です。
また、これらのモデルがリリースされた後に生じる問題が適切に対処されるようにすることも同様に重要です。Anthropic は、この新しいクラスのモデルの機能に対する考え方と、報告された問題への対応に関するコミットメントおよび SLA(サービスレベルアグリーメント)を説明するブログ「Redeploying Fable 5」(https://www.anthropic.com/news/redeploying-fable-5) を公開しました。私たちは、サイバー機能を備えたモデルに対する問題の深刻度と対応のための最初の枠組みを明確に示した Anthropic の透明性と協力を高く評価しており、業界全体でこの枠組みを学びながら洗練させていく継続的な対話を楽しみにしています。
当社の AI レッドチームは、Anthropic と協力して Fable の保護機能をさらに強化し、その最新のガードレールが非常に能力の高いモデルでありながら、敵対者による悪用のリスクを最小限に抑えるものであると確信しています。このモデルは、ほとんどのドメインにおいて推論能力が大幅に向上するという約束を果たす一方で、敵対者に新たな重大なセキュリティ機能を提供することはありません。ガードレールが発動された場合、自動的に Opus 4.8 にフォールバックします。Opus 4.8 はすでに一般公開されている世界クラスのモデルです。
Anthropic のパートナーシップと、防御者へのコミットメントに感謝するとともに、業界全体と共に協力し、フロンティアモデルを安全かつ確実に利用可能にし続けることを楽しみにしています。
著者について

Amy Herzog
Amy Herzog は、セキュリティを最優先事項とする企業である Amazon Web Services (AWS) の副社長兼チーフインフォメーションセキュリティオフィサー(CISO)を務めています。ここではクラウドセキュリティの専門家からなるグローバル組織を率いています。AWS 入社以前には、Amazon のデバイス&サービス部門、メディア&エンターテインメント部門、広告事業部の CISO を務め、Alexa+ や Ring などの消費者向け技術製品のセキュリティを統括しました。また、低軌道衛星を通じて世界中の顧客やコミュニティに高速で信頼性の高いブロードバンドを提供する Amazon の取り組みである Project Kuiper の安全な開発において中心的な役割を果たしました。
原文を表示
It’s our goal for AWS to be the most secure place to run any workload, and in support of that we’ve been deeply investing in security across our services since AWS’s inception more than two decades ago. Our AI services like Amazon Bedrock are built on this foundation and with the same focus. Bedrock provides customers with world-class performance, security and privacy as well as the broadest selection of models available anywhere. Last year we launched Bedrock Mantle with industry-leading privacy and protection for model weights. We regularly hear from customers that they want access to the latest models as quickly as possible after they’re released and Bedrock delivers this for them along with the enterprise features that customers expect from AWS. We are excited that Anthropic’s Claude Fable 5 models will be available again to our customers on Bedrock starting tomorrow, and that they feature even stronger guardrails to prevent misuse.
When releasing models, we consider not only our responsibilities to our customers, but to the Internet and society as a whole. The most recent generation of frontier models, such as Anthropic’s Claude Mythos have powerful new capabilities, particularly in the area of cybersecurity. We’ve been able to experience this first hand as part of Project Glasswing and we’re eager to get Mythos-class models into the hands of defenders. As defenders, we have the opportunity to use these models to make the systems on which we all depend materially more secure. But as we do, we must also ensure that we don’t also give our adversaries meaningfully advanced visibility and capabilities, without giving companies, governments, and academic institutions the opportunity to protect their assets first. Striking this balance is a key challenge for broad model release, which is why we’ve been working closely with Anthropic and other industry partners in Project Glasswing to refine the guardrails for this new class of models. We all agree that preventing adversaries from gaining access to the ability to do deep vulnerability research is the most important objective for these guardrails.
This is also an exciting time for AI, with new capabilities being delivered almost daily. We believe that making the capabilities of these advanced models available to all customers in a secure, privacy preserving environment is critical to ensuring that they can get the many benefits without creating security risks. It’s important that new guardrails continue to be developed as we learn more about how well the current ones are working and as new models get released. We’re going to keep iterating with our partners, delivering more value, and being responsive to changes in the industry.
It’s equally important to make sure any issues with these models after they are released get addressed appropriately. Anthropic has published a blog, Redeploying Fable 5, that explains how they’re thinking about the capabilities of this new class of models, and their commitments and SLAs for responding to issues that are reported to them. We appreciate Anthropic’s transparency and collaboration in articulating this first structure for issue severity and response for cyber-capable models, and we look forward to the ongoing conversation across our industry as we learn and refine it.
Our AI Red Team has worked with Anthropic to further improve Fable’s protections, and we believe its latest guardrails result in a very capable model that further minimizes the risk of misuse by adversaries. It delivers on the promise of much stronger reasoning capabilities in most domains, without giving adversaries significant new security capabilities. When the guardrails are triggered, it automatically falls back to Opus 4.8, itself a world-class model that is already publicly accessible.
We appreciate Anthropic’s partnership and commitment to defenders, and look forward to working with them and the rest of the industry to continue to make frontier models available safely and securely.
About the author

Amy Herzog
Amy Herzog is Vice President and Chief Information Security Officer (CISO) at Amazon Web Services (AWS) where she leads a global organization of cloud security professionals in a company in which security is the top priority. Prior to joining AWS, Amy served as CISO for Amazon’s Devices and Services, Media and Entertainment, and Advertising businesses, overseeing the security of consumer technology offerings such as Alexa+ and Ring, and playing a key role in the secure development of Project Kuiper, Amazon’s initiative to provide fast, reliable broadband to customers and communities around the world through low earth orbit satellites.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み