Claude Fable 5 の発表(6 分間の読み物)
Anthropic は、クリエイティブ分野での利用を強化するより高度なストーリー作成機能を備えた AI 物語生成ツール「Claude Fable」のバージョン 5 を正式に発表した。
キーポイント
新バージョンの発表と機能強化
Anthropic が物語生成ツール「Claude Fable」のバージョン 5 を公開し、ストーリー作成能力を高度化させた。
クリエイティブ分野への焦点
新機能は特にクリエイティブな分野での利用を想定・強化しており、物語制作のプロセスを支援する。
ツールとしての進化
単なるテキスト生成を超え、より構造化された物語作成や創造的なアイデアの具現化を可能にする方向へ進化した。
影響分析・編集コメントを表示
影響分析
この発表は、生成 AI がテキスト作成の枠を超え、物語構造や文脈理解といった高度なクリエイティブ領域へ本格的に参入したことを示しています。特にストーリーテリングという複雑なタスクに対するモデルの能力向上は、エンターテインメント産業や教育コンテンツ制作におけるワークフロー変革の契機となる可能性があります。
編集コメント
単なる機能アップデートではなく、AI が『物語を作る』という高度な創造行為に特化したツールとして成熟した段階に入ったことを示す重要なマイルストーンです。クリエイター支援領域での競争がさらに激化しそうです。
本日、Claude Fable 5をリリースいたします。これは一般利用に安全化されたMythos クラス1のモデルです。
Fable 5 の能力は、これまで一般提供してきたどのモデルよりも優れています。AI 能力に関するほぼすべてのテストベンチマークにおいて最先端であり、ソフトウェアエンジニアリング、知識労働、ビジョン(画像認識)、科学研究、および多くの他の分野で卓越したパフォーマンスを示しています。タスクが長く複雑になるほど、Fable 5 は他モデルに対するリードを拡大します。
このように高度な能力を持つモデルのリリースにはリスクが伴います。保護策がなければ、サイバーセキュリティなどの分野における Fable 5 の能力が悪用され、深刻な被害を引き起こす可能性があります。そのため、本モデルは特定のトピックに関する問い合わせに対しては、次点で最も能力の高いモデルであるClaude Opus 4.8からの回答を受け取るよう、保護策を備えてリリースされました。安全かつ迅速にモデルを公開するため、これらの保護策は保守的に調整されており、無害なリクエストも時折検出されますが、平均してセッションの5%未満でトリガーされています。今後数ヶ月内にさらに高度なモデルが登場する見込みであるため、私たちは保護策の改善と誤検知(false positives)の削減を可能な限り迅速に行うよう取り組んでいます。
小規模のサイバー防衛者およびインフラプロバイダー向けに、Claude Mythos 5も同時にローンチします。これは Fable 5 と同じ基盤モデルですが、一部の領域における安全対策が解除されています。Mythos 5 は当初、米国政府との協力により Project Glasswing を通じて展開され、Claude Mythos Preview のアップグレードとして提供されます。これは世界で最も強力なサイバーセキュリティ機能を備えたモデルです。今後は、より広範な信頼アクセスプログラムを通じて Myths 5 へのアクセスを拡大する予定です。
Fable 5 や Mythos 5 といったモデルの能力は、世界に対して多大な好影響をもたらす可能性があります。これは Project Glasswing においてすでにその萌芽が見られており、これらのモデルが サイバー防衛者を支援 し、極めて重要なソフトウェアを保護している事例があります。また、ライフサイエンス研究の分野でも、モデルが新たな仮説を提示し、新薬の開発を加速させている様子を確認しています。
Fable 5 と Mythos 5 は、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルで提供されます。これは Claude Mythos Preview の価格の半分未満です。今回の共同ローンチは、可能な限り迅速かつ安全に、高度な AI 機能をできるだけ多くの人々に届けるという当社の目標に向けた、もう一つのステップとなります。
以下の表では、Fable 5 と Mythos 5 の能力を他の主要モデルと比較しています。

**Fable 5 と Mythos 5 は、過去のどの Claude モデルよりも長く自律的に動作することが可能です。以下では、これらのスキルがソフトウェアエンジニアリングにどのように適用されるかについて議論し、モデルの知識労働、ビジョン(画像認識)、メモリ、および生命科学研究における改善された能力について解説します。
*ソフトウェアエンジニアリング。** 初期テスト段階において、Stripe は Fable 5 が数ヶ月分の工程を数日に圧縮できたと報告しました。5000 万行の Ruby コードベースにおいて、このモデルは本来チーム全体で手作業を行うと 2 ヶ月以上かかるコードベース全体の移行を、わずか 1 日で完了させました。Fable 5 はまた、過去の Claude モデルよりもトークン効率が優れています:高品質なプロダクションコードベースの基準を満たしつつ困難なコーディングタスクを解決できるかどうかを検証する Cognition の FrontierCode 評価において、Fable 5 は中程度の努力レベルでも最先端モデルの中で最高スコアを獲得しています。


*知識労働*。Fable 5 は複雑な分析タスクにおいて強力なパフォーマンスを示します。シニアレベルの推論に関する Hebbia の財務ベンチマークでは、Fable 5 はあらゆるモデルの中で最高スコアを記録し、文書に基づく推論、チャートや表の解釈、問題解決において大幅な向上が見られました。IMC は、事実参照、概念的推論、根本原因分析、期待値分析を含む取引分析評価において、Fable 5 がほぼ全面的に完璧な結果を収めたと指摘しています。
*ビジョン機能*。Fable 5 は視覚に関連するタスクにおける新たな最先端モデルです。詳細な科学図から正確な数値を抽出でき、スクリーンショットのみからウェブアプリのソースコードを再構築するような複雑な視覚ベースのタスクも実行可能です。また、事前準備(スキャフォールディング)が少なくて済みます。例えば、以前の Claude モデルは追加の有用なツールを提供するハネス(支援枠組み)を用いても『ポケモンファイアレッド』をプレイすることに苦戦していましたが、Fable 5 は最小限の視覚専用ハネスでファイアレッドをクリアしました。
*記憶と長文脈処理*。Fable 5 は数百万トークンにわたる長時間タスクにおいても集中力を維持し、自身のノートを用いて出力を改善します。モデルにデッキ構築ゲーム『Slay the Spire』をプレイさせた際、永続的なファイルベースのメモリへのアクセス権限を与えたことで、Opus 4.8 の場合よりもパフォーマンスが3倍向上しました。また、Fable はゲームの最終章に到達する頻度も3倍高まりました。
*創薬:* Mythos 5 を用いることで、当社の内部タンパク質設計の専門家が創薬プロセスの一部を約10倍加速しました。ある事例では、Mythos 5 はタンパク質設計ツールとバイオインフォマティクスツールのみを用い、人間の支援なしで熟練した人間オペレーターに匹敵し、あるいは凌駕することが判明しました。これにより、モデルは通常科学者が完了させるすべてのタスクを実行します:結合部位の選択、タンパク質設計ツールの選定と実行、そしてその過程での失敗からの回復です。この研究から得られた14のタンパク質標的のうち9つ(以下に示す)が、現在調査中の創薬のための有力な候補となりました。
image*Mythos 5 が設計したタンパク質複合体。標的には免疫チェックポイント、成長因子および受容体シグナル伝達、神経変性疾患、筋疾患、そしてより困難な構造標的が含まれます*。
*分子生物学における新仮説。* Mythos 5 は、一貫して新規かつ魅力的な科学的仮説を生成する最初のモデルです。Opus クラスのモデルとの盲検比較において、当社の科学者たちは Mythos の分子生物学に関する仮説を約 80% の頻度で選択し、いくつかの実験評価へと進めています。その間、Mythos が提案したある一つの仮説(*大腸菌*タンパク質に対する新規メカニズム)は、同じ問題に取り組む独立した研究所による研究 a study において裏付けられました。
*ゲノム学における新規研究。* Mythos 5 は、ほぼ自律的な作業を約 1 週間行い、ゲノム学に関する新規研究を実施しました。同モデルは、138 種の動物にまたがる数百万細胞の単一細胞データを統合し、遠縁な生物間でも同じ役割を果たす細胞を特定するために、カスタムの機械学習モデル(machine learning model)を設計・訓練しました。高レベルの人間的入力のみを用いたにもかかわらず、Mythos 5 が訓練したモデルは、*Science*誌に最近掲載されたモデルを上回る性能を発揮しました。ただし、そのサイズは約 100 分の 1 です。これらの結果については、今後数ヶ月以内に発表する予定です。
*整合性*。自動的な整合性評価において、Mythos 5 の不整合行動(モデルによる欺瞞や、ユーザーによるモデルの悪用への協力などを含む)のレベルは低く、Opus 4.8 と同程度であることが判明しました。これらは同じ基盤モデルであるため、Fable 5 の整合性レベルも同様になると考えられます。この評価の詳細およびその他の安全性・能力テストの詳細な一連の結果については、モデルの システムカード に記載されています。
image自動的な整合性評価における不整合行動の全体的なレベル。詳細は システムカード のセクション 6.2.3.1 を参照してください。
Claude Fable 5 に関する初期フィードバック
早期アクセス権を持つ顧客が Fable 5 で独自のテストを実施しました。以下に、彼らが報告している内容の一部をそのまま紹介します:
Claude Fable 5 は CursorBench において最先端のモデルです。これは、以前のモデルでは手が届かなかった長期にわたる課題のクラスを可能にしました。
Claude Fable 5 は、GitHub が提供する開発者にとって、実りある一歩前進です。初期テストでは、複雑で長期にわたるコーディングタスクに対し、以前のベンチマークを上回る自律性と信頼性を持って取り組むことができました。しかし、私たちが最も興奮しているのは、それが示す方向性です。それは、開発者がより野心的な作業をエージェントに任せることができ、ソフトウェアのライフサイクル全体を通じてその結果を信頼できる未来へと向かうものです。
これらは、私たちがテストの機会を得たClaudeモデルの中で最も強力な結果です。Claude Fable 5 は、エージェントによるコーディングとプロトタイピングにおいて明確な一歩前進を示しています。
Claude Fable 5 の推論能力は、Opus 4.8 を明確に上回っています。シニア研究科学者レベルで動作し、方向性を決定し、リソースを配分し、誤った信念を捨て去り、新たな第一原理に基づく成果を生み出します。
Claude Fable 5 は、開発者が入力する文字列だけでなく、彼らが何を意図しているかを理解します。昨年は百回ものプロンプトを必要としたアプリでも、現在はワンショットで完了させます。顧客が本当に壁にぶつかった際、私たちは彼らを素早く乗り越えさせて目標の達成へと導くためにこのモデルを活用します。
Claude Fable 5 は、明らかに異なる印象を与えます。ブラインドレビューにおいて、当社の弁護士は、その修正箇所が現在のモデルと同等か、あるいはそれを上回ることを毎回確認しました。
最高レベルの努力を要する場面において、Claude Fable 5 は自身の作業を振り返り、検証を行います。私たちにとって、これが高度な自律的な運用を可能にする要因です — その追加的思考が、自らのコストを上回る価値を生み出すのです。
Claude Fable 5 は、以前のモデルよりも少ないターンで、より能力の高いエンジニアリングを実現します。これは、社員が Claude Code で日常的に実行している複雑なマルチエージェントワークフローを処理するものです。
Claude Fable 5 は、Cognition の最先端コーディング評価である FrontierBench で最高スコアを獲得したモデルです。長期の推論に優れており、未知のツールに対しても、特別な設定なしで汎化して動作します。
Claude Fable 5 は、私たちがテストした中で、一般財務および推論の両面で最も強力な財務特化型モデルです。これは目覚ましい進歩と言えます。
Claude Fable 5 は、複雑で長時間実行される分析タスクに対する当社のコア分析ベンチマークにおいて、90% を突破した初のモデルです。これは Opus よりも 10 ポイントの向上です。最も難しい質問においては、強い判断力と細部への注意を示しています。

Claude Fable 5 は、推論トークンの使用量を 3 分の 1 に抑えながら、最先端の物理学研究において当社がテストした中で最も強力なモデルです。36 時間という短期間で、GPT-5.5 が 4 日間かけて到達したレベルにほぼ達しました。
エンドツーエンドの「バイブコーディング」ベンチマークである ViBench において、Claude Fable 5 は当社がテストした中で最高性能を示すモデルです。基本的なユースケースをほぼ完全に満たし、より少ないトークン数で、かつより短い時間でアプリケーションを構築しています。
Claude Fable 5 は、あらゆる努力レベルにおいて、当社の日常的なスプレッドシートスイートで Opus 4.8 を上回ります。さらに、ターン数を減らし、実行を 25〜30% 高速化して完了させます。
01 /
14
クロード・フェイブル 5 の新たなセーフガード
ミソス級モデルは、重大なリスクを提示する閾値に達しました。4 月には Project Glasswing を開始し、最初のミソス級モデル(Claude Mythos Preview)を限られたサイバー防衛担当者および重要ソフトウェアインフラプロバイダーのみに対してリリースしました。その際、私たちが新たなセーフガードを開発し、それらが誤用を確実に防止するのに十分な強度を持っている限りは、最終的に Mythos レベルの機能をすべてのユーザーに提供したい と述べていました。
過去数ヶ月の間、私たちはこれらのセーフガードを改善し続けており、現在は一般リリースに耐えうる十分な堅牢性を備えています。安全性を最優先した結果、意図的にセーフガードを慎重に調整しており、現時点では理想的な状態よりも厳格です。例えば、無害なリクエストでも分類器が作動することがあります。これが一部のユーザーにとって不満になることは認識していますが、リリース後にセーフガードを更新・洗練させることで、偽陽性を減らすことを目指しています。
以下に、フェイブル 5 の各新たなセーフガードについて順を追って説明します。より広範なセーフガードのスイートについては、モデルの システムカード および最新の リスクレポート で議論・評価されています。
セーフティ分類器
Mythos クラスモデルの最先端サイバーセキュリティおよび研究生物学機能は、悪意のあるアクターに対する*アップリフト*(uplift)の重大なリスクをもたらすことを意味します。つまり、これらのモデルは、他のソース(例えばインターネット検索エンジンなど)では得られなかった深刻な危害を引き起こすのを助ける情報や助言を提供する可能性があります。さらに、AI モデルの高度な利用の多くはデュアルユース(二重用途)です:サイバーセキュリティ専門家や生物学研究者にとって有益な同じクエリが、悪意のあるアクターに利用可能になった場合、危険なものとなり得ます。
したがって、誤用を防ぐための強力なセーフガードが必要であり、その適用範囲は広範である必要があります。これらのセーフガード自体も、持続的かつ巧妙な回避試行(「システムへの脱獄」とも呼ばれる)に耐えうるものでなければなりません。Mythos レベルの能力による向上は、サイバー攻撃から経済的利益を得る可能性のある敵対者など、多くの敵対勢力にとって価値あるものとなるため、彼らが私たちの安全対策を回避しようとする動機を持つことは確実です。
Fable 5 は、潜在的な悪用(ジールブレイク試行など)を検出し、メインモデル(この場合は Fable 5)が応答しないように防止する、新しいセットの*分類器* (classifiers) を搭載しています。私たちはこれまで数ヶ月にわたり、モデルに対して分類器 for some time を運用しており、Fable 5 の分類器は、この先行研究を拡張し、さらに広範なカバレッジを追加したものです。
Fable の分類器がサイバーセキュリティ、生物学・化学、あるいは蒸留に関連するリクエストを検知した場合、その応答は自動的に Claude Opus 4.8 によって処理されます。ユーザーにはこのような事態が発生した際に必ず通知が行われます。Opus 4.8 はそれ自体が非常に能力の高いモデルであり、Fable から Opus へフォールバック(後退)する応答は、Fable が完全に拒絶するよりもはるかに優れた体験となります。初期データによると、Fable セッションの 95% 以上にはフォールバックは一切発生しておらず、そのようなセッションにおいては Fable 5 のパフォーマンスは Mythos 5 と実質的に同等です。
分類器がカバーする領域は以下の通りです:
*1. サイバーセキュリティ*. Mythos クラスのモデル 優れているのは、ソフトウェアの脆弱性を発見し、それを利用することです。これにより、サイバー攻撃を実行することが大幅に容易かつ安価になります。また、Mythos クラスのモデルは、アジェンティック・ハッキング(自律型ハッキング)においても強力なスキルを示します。これは、エクスプロイト(脆弱性悪用)を見つけることに加え、偵察、発見、横方向への移動など、サイバー攻撃の複数の異なる部分を遂行することを指します。これらのアジェンティック・ハッキングのスキルがサイバー攻撃を助長しないよう、当社のサイバーセキュリティ分類器は、エクスプロイト利用だけでなく、より広義の意味での攻撃的サイバータスクもカバーするように設計されています。以下のグラフに示す通り、この分類器により Fable はこれらのタスクにおいて一切進展することが防止されます。
image*サイバー評価の実行結果。Fable 5 を、Opus 4.8 にフォールバックするのではなく応答をブロックするモードで実行したものです。評価にはセーフガードの回避を試みる行為は含まれていません。
私たちは分類器に対して広範なレッドチーム(敵対的テスト)を実施し、ジールブレイクに対する堅牢性を検証しました。内部テストに加え、外部バグバウンティプログラムも実施しましたが、1,000 時間以上のテストにおいて普遍的なジールブレイクは見つかりませんでした。私たちが関与させた外部レッドチーム組織も、長文のエージェントタスクにおける普遍的なジールブレイクをまだ見つけるに至っていません—ただし、英国 AI セーフティ研究所(AISI)は短い初期テスト期間内にその実現に向けた進展を見せています。4 普遍的なジールブレイクを完全に防止することは不可能である可能性が高いですが、私たちの目標は、残存するジールブレイクが十分に遅く、コストがかかるものとし、大規模利用される前に検知して阻止できるようにすることです。
以下のグラフは、内部評価のうちの1つからのものであり、Fable 5 のセーフガードが、以前の一般公開モデルと比較して、ジールブレイクに対するより高い耐性を持っていることを示しています:
image*攻撃的なサイバーセキュリティに関連する短時間のタスクを完了させるために、自動化されたレッドチーム(内部評価チーム)がモデルを試行した際の内部評価結果。この試行は 400 ターンにわたり、ブロックされた場合はリスタートまたは巻き戻しが行われます。タスクの多くは単純であり、実際のサイバー利用を代表するものではありません—時にはリモートサーバー上のファイルを暗号化するといった極めて簡単なものさえあります。より複雑で現実的なタスクについては、まだ本番システム上で成功した Jailbreak(セキュリティ回避)事例は確認されていません。なお、Opus 4.6 にはサイバー関連のブロック機能は搭載されていません。
外部パートナーの一人が、Fable 5 の有害なサイバー問い合わせに対するガードレール(安全装置)は、テストされたすべてのモデル(Opus 4.8 および Opus 4.7 を含む)の中で最も堅牢であると発見しました。Fable 5 は、サイバー攻撃の計画、エクスプロイト開発、または防御回避に関連する有害な単一ターンリクエストに対してゼロのコンプライアンス違反を示しました。これは、30 の異なる公開 Jailbreak テクニックのいずれかがリクエストに含まれていたかどうかにかかわらず成立しています。
*2.生物学と化学*。私たちは長年、分類器を用いて、生物兵器関連の限定的な問い合わせに対してモデルが回答しないようブロックしてきました。しかし、この限定的なブロックだけで十分であるとはもはや確信できません。その理由は二つあります。第一に、リソースを豊富に持つ悪意のあるアクターが、極めてリスクの高い生物学研究においてモデルからの向上を得ようと試みていることへの懸念材料があるからです。第二に、モデルは現在、現実世界の科学課題を達成する能力をより高めています。
例えば、Mythos 5 の能力を評価した際、アデノ随伴ウイルス(AAV)の設計における困難なステップの完了においてその力を確認しました。AAV は遺伝子治療を届けるための構成要素ですが、同じ能力が不適切な手に渡る場合、危険なウイルスの設計を可能にしてしまうリスクがあります。このタスクでは、さまざまな AI モデルが、Dyno Therapeutics が開発した治療的に関連する未発表候補群の中から、遺伝子改変がウイルスの外殻(アセンブリ)に与える影響を予測する能力について評価されました。私たちはモデルに対してこのタスクを実行するように明示的に訓練していませんでしたが、それでも Mythos クラスのモデルは、生物学的推論のみを用いてタンパク質専用タスクに特化した高度なモデル(「タンパク質言語モデル」と呼ばれる)を上回りました。これは遺伝子治療の研究開発において単純だが重要なタスクを完了する有望な能力を示す一方で、そのような二重利用可能な能力がもたらすリスクも浮き彫りにしています。
image*単純なウイルスのウイルスカプシド(viral shell)の未発表の実験的性質を予測した評価の結果。この文脈では、ウイルスカプシドの自己集合は予測可能な最も単純なウイルス特性ですが、より複雑な機能を設計する際にこれを正しく把握することは依然として重要な要素です。AAV = アデノ関連ウイルス(adeno-associated virus)。*
私たちの優先事項は、過度に広範な安全対策を講じるコストがかかっても、できるだけ早く Fable を安全にリリースすることでした。そのため、当面の間、生物学および化学に関するほとんどのリクエストに対して、Fable は Opus 4.8 にフォールバック(fallback)するように設定しています。他のすべての分類器と同様に、これらの安全対策を可能な限り早期に縮小することを望んでいます:上記の証拠から明らかなように、科学分野における Fable のポジティブな応用には大きな可能性があり、分類器による偽陽性(false positives)がそれを妨げることは避けたいと考えています。今後数週間で、一部の生物医学研究者や企業が、以下で議論する Mythos 5 の生物学機能に対する信頼アクセスプログラムに参加できるようになります。
*3. 蒸留*. これまでに、権威主義的な国において Claude の能力を抽出(「蒸留」)して競合するモデルの訓練に利用しようとする大規模な試行が複数確認されています。Fable 5 の能力を蒸留することは、間接的に最前線に近い AI 能力の普及につながりかねず、これらの能力は適切な安全対策なしに公開される可能性があります。当社の分類器によってそのような蒸留試行の一部と判定されたリクエストは、Opus 4.8 にフォールバックされます。
新しいデータ保持ポリシー
最後に、Fable 5、Mythos 5、および同程度以上の能力を持つ将来のモデルに関するビジネス顧客データの取り扱い方法を変更します。Mythos クラスのモデルにおけるすべてのトラフィック(自社サービスおよびサードパーティのプラットフォームを含む)について、30 日間の保持を義務付けます。このデータは新しい Claude モデルの訓練や、安全関連以外の目的には一切使用しません。また、人間によるデータアクセスのすべてをログ記録し、ほぼ全てのケースで 30 日後にデータを削除するなどの新たなプライバシー保護措置を導入しました(詳細についてはこちらの記事をご覧ください)。このデータは、複雑かつ新しい攻撃(新たな jailbreak や複数のリクエストにわたって動作する攻撃を含む)への防御や、誤検知の特定と削減に役立ちます。
クロード・ミソス5と信頼アクセスプログラム
本日より、現在Claude Mythos Previewへのアクセス権を持つすべてのユーザー(例えば、Project Glasswingにおけるサイバーセキュリティパートナー)は、Claude Mythos 5へアップグレードできるようになります。これはClaude Fable 5と同じモデルですが、サイバーセーフガードが解除されたものです。ほとんどのケースにおいて、Mythos 5はMythos Previewと同等か、やや強力である一方、コストは大幅に削減されます。
米国政府との協議に基づき、Claude Mythos 5へのアクセスを着実に拡大していく計画です。これは、新たなパートナーの定期的な追加(期間ごとの追加)を引き続き行うことと、サイバーセキュリティ組織がより体系的に申請できる信頼アクセスプログラムの推進を含みます。
私たちの計画には、生物学分野における信頼アクセスプログラムを開設し、Mythosクラスの能力を活用して生物医学研究の加速や新治療法の発見を支援することも含まれています。このプログラムでは、生物学および化学セーフガードは解除されるものの、サイバーセーフガードは維持された状態でFable 5へのアクセスが提供されます。基礎研究から転換研究まで多様なライフサイエンス組織から少数の研究員を対象に募集し、プログラムのアクセス拡大と並行してセーフガードの強化を図る予定です。
Availability
Claude Fable 5 は本日、どこでも利用可能です。Claude Mythos 5 は、サイバーセキュリティ対策が解除された Glasswing パートナー限定、および生物・化学分野の対策が解除された一部の生物学研究者限定で提供されており、より広範な信頼アクセスプログラムが利用可能になるまでこの制限が続きます。
両モデルの料金は、入力トークン 100 万あたり 10 ドル、出力トークン 100 万あたり 50 ドルです。開発者は Claude API を通じて claude-fable-5 を利用できます。
Fable 5 への需要は非常に高く、予測が困難であると予想しています。Claude API および従量課金制の Enterprise プランでは、Fable 5 は本日より完全に利用可能です。サブスクリプションプランについては、後からではなく早めにアクセスを提供したいと考えているため、段階的に慎重に展開していきます。
- 今日から 6 月 22 日まで、Pro、Max、Team、およびシートベースの Enterprise プランには Fable 5 が追加料金なしで含まれます。
- 6 月 23 日以降、これらのプランから Fable 5 は除外されます。それ以降の利用には利用クレジットが必要です。容量が許せば、無料提供期間を延長する予定です。
- この時点以降、十分な容量が確保され次第、Fable 5 をサブスクリプションプランの標準機能として復元することを目標としています。可能な限り迅速に実施します。
この期間中、状況の変化については事前に周知し、ユーザーの皆様に現状をお知らせいたします。
*2026 年 6 月 9 日更新:AAV(アデノ随伴ウイルス)に関する記述を更新し、候補が Dyno Therapeutics によって開発されたものであることを明記しました。
Related content
クロード・パートナー・ネットワークのサービストラックとパートナーハブのご紹介
AI を活用したサイバー脅威を 1 年間マッピングして得た教訓
AI がサイバー攻撃の性質や背後にある手法を変革する中、セキュリティコミュニティが使用する技術やフレームワークはどの程度有効なのでしょうか?新しいレポートで、私たちはその問いに答えようとしています。
プロジェクト・グラスウィングの拡大
プロジェクト・グラスウィングを、15 カ国以上にある約 150 の新たな組織に拡張します。
原文を表示
Today we’re launching Claude Fable 5: a Mythos-class1 model that we’ve made safe for general use.
Fable 5’s capabilities exceed those of any model we’ve ever made generally available. It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional performance in software engineering, knowledge work, vision, scientific research, and many other areas. The longer and more complex the task, the larger Fable 5’s lead over our other models.
Releasing a model this capable comes with risks. Without safeguards, Fable 5’s capabilities in areas like cybersecurity could be misused to cause serious damage. We’ve therefore launched the model with safeguards that mean queries on some topics will instead receive a response from our next-most-capable model, Claude Opus 4.8. To release the model both safely and quickly, we’ve tuned these safeguards conservatively—they’ll sometimes catch harmless requests, though they trigger, on average, in less than 5% of sessions. With more capable models arriving in the coming months, we’re working to improve our safeguards and reduce false positives as quickly as we can.
For a small group of cyberdefenders and infrastructure providers, we’re also launching Claude Mythos 5. It’s the same underlying model as Fable 5, but with the safeguards lifted in some areas.2 Mythos 5 will initially be deployed through Project Glasswing, in collaboration with the US government, as an upgrade to Claude Mythos Preview. It has the strongest cybersecurity capabilities of any model in the world. Soon, we intend to expand access to Mythos 5 through a broader trusted access program.
The capabilities of models like Fable 5 and Mythos 5 have the potential to do profound good for the world. We’ve seen the beginnings of this in Project Glasswing, where the models have helped cyber defenders secure critically important software. We’ve also seen it in life sciences research, where the models are positing novel hypotheses and speeding up the development of new therapeutics.
Fable 5 and Mythos 5 are being offered at $10 per million input tokens and $50 per million output tokens—less than half the price of Claude Mythos Preview. Today’s joint launch is another step towards our goal of bringing advanced AI capabilities to as many users as possible, as quickly and as safely as we can.
The table below compares the capabilities of Fable 5 and Mythos 5 to other leading models.

**Fable 5 and Mythos 5 can work autonomously for longer than any previous Claude models. Below we discuss how these skills apply to software engineering, and cover the model’s improved capabilities in knowledge work, vision, memory, and life sciences research.
*Software engineering. *During early testing, Stripe reported that Fable 5 compressed months of engineering into days. In a 50-million-line Ruby codebase, the model performed a codebase-wide migration in a day that would otherwise have taken a whole team over two months by hand. Fable 5 is also more token-efficient than past Claude models: on Cognition’s FrontierCode evaluation, which tests whether models can pass difficult coding tasks while meeting the standards of high-quality production codebases, Fable 5 scores highest among frontier models, even at medium effort.


*Knowledge work*. Fable 5 shows strong performance on complex analytical tasks. On Hebbia’s Finance Benchmark for senior-level reasoning, Fable 5 has the highest score of any model, with substantial gains in document-based reasoning, chart and table interpretation, and problem solving. IMC noted that Fable 5 aced their trading-analysis evaluations nearly across the board, including factual lookup, conceptual reasoning, root-cause analysis, and expected-value analysis.
*Vision.* Fable 5 is the new state-of-the-art model for tasks involving vision. It can extract precise numbers from detailed scientific figures and can perform complex vision-based tasks like rebuilding a web app’s source code from screenshots alone. It also needs less scaffolding: for example, previous Claude models struggled to play Pokémon FireRed even with harnesses that gave them additional helpful tools, but Fable 5 beat FireRed with a minimal, vision-only harness.
*Memory and long-context. *Fable 5 stays focused across millions of tokens in long-running tasks and improves its outputs using its own notes. When we had the model play the deck-building game Slay the Spire, giving it access to persistent file-based memory improved its performance three times more than for Opus 4.8; Fable also reached the game’s final act three times more often.
*Drug design:* Using Mythos 5, our internal protein design experts accelerated aspects of the drug design process by around ten times. In one example, they found that Mythos 5, with protein design and bioinformatics tools but no human assistance, matches or beats skilled human operators. In doing so, the model executes all of the tasks that are normally completed by a scientist: choosing binding sites, selecting and running protein design tools, and recovering from failures along the way. Nine of the 14 protein targets from this study (shown below) yielded strong candidates for drug design that we’re currently investigating.

*Novel hypotheses in molecular biology.* Mythos 5 is our first model to consistently produce novel, compelling scientific hypotheses. In blinded head-to-head comparisons against Opus-class models, our scientists preferred Mythos’s molecular biology hypotheses ~80% of the time, and have advanced several to experimental evaluation. In the meantime, one Mythos hypothesis—a novel mechanism for an *E. coli* protein—was corroborated in a study from a lab independently working on the same problem.
*Novel research in genomics.* **Mythos 5 conducted novel genomics research in over a week of largely autonomous work. It assembled single-cell data for millions of cells spanning 138 animal species and designed and trained a custom machine learning model to identify cells performing the same role in even distantly related organisms. With only high-level human input, Mythos 5’s trained model outperformed a recent model published in the journal *Science*—despite being 100 times smaller. We intend to publish these results in the coming months.
*Alignment*. In our automated alignment assessment we found that Mythos 5’s level of misaligned behavior (including misaligned actions taken by the model such as deception, and cooperation with misuse of the model by a user) was low, and similar to that of Opus 4.8. Given they are the same underlying model, Fable 5’s level of alignment will be similar. The assessment is described in full, along with a detailed suite of other safety and capabilities tests, in the model’s system card.
Overall level of misaligned behaviors from our automated alignment assessment. See section 6.2.3.1 of the [system card for more.](https://www.anthropic.com/_next/image?url=https%3A%2F%2Fwww-cdn.anthropic.com%2Fimages%2F4zrzovbb%2Fwebsite%2F2502a0daf85b741641cff36757d7243ef48f8be8-3840x2160.png&w=3840&q=75)
Early feedback for Claude Fable 5
Customers with early access ran their own tests on Fable 5. Below, in their words, is a selection of what they’re seeing:
Claude Fable 5 is the state of the art model on CursorBench. It's opened up a class of long-horizon problems that were out of reach for earlier models.
Claude Fable 5 is a real step forward for the developers GitHub serves. In our early testing, it took on complex, long-horizon coding tasks with a level of autonomy and reliability that exceeded previous benchmarks. But what excites us most is the direction it points: a future where developers can hand increasingly ambitious work to agents and trust the results across the software lifecycle.
These are the strongest results of any Claude model we've had the opportunity to test. Claude Fable 5 is a clear step forward on agentic coding and prototyping.
Claude Fable 5's reasoning is a clear step beyond Opus 4.8. It works at senior research scientist grade — picking directions, allocating resources, killing its incorrect beliefs, and producing novel first-principles outputs.
Claude Fable 5 understands what builders mean, not just what they type. Apps that took a hundred prompts a year ago, it now one-shots. When a customer really hits a wall, it's the model we reach for to get them past it quickly, so they can finish what they set out to build.
Claude Fable 5 feels materially different. In blind review, our lawyers found its redlines matched or beat our current model every time.
At the highest effort, Claude Fable 5 reflects on and validates its own work. For us, that's what makes highly autonomous operations possible — the extra thinking pays for itself.
Claude Fable 5 delivers more capable engineering in fewer turns than prior models — handling the complex multi-agent workflows our employees run daily in Claude Code.
Claude Fable 5 is the highest-scoring model on FrontierBench, Cognition's frontier coding eval. It excels at long-horizon reasoning and generalizes to unfamiliar tools out of the box.
Claude Fable 5 is the strongest finance-first model we've tested, both on general finance and reasoning. It's a notable step up.
Claude Fable 5 is the first to break 90% on our core analytics benchmark of complex, long-running analytical tasks — a 10-point jump over Opus. On the hardest questions, it shows strong judgment and attention to nuance.

Claude Fable 5 is the strongest model we've tested on frontier physics research while using a third of the reasoning tokens. In 36 hours it got nearly to where GPT-5.5 landed after four days.
On ViBench, our end-to-end vibe-coding benchmark, Claude Fable 5 is the highest-performing model we've tested — nearly saturating our base use cases and building apps in less time with fewer tokens.
Claude Fable 5 beats Opus 4.8 on our everyday spreadsheet suite at every effort level — and it does it with fewer turns, finishing runs 25–30% faster.
01 /
14
Claude Fable 5’s new safeguards
Mythos-class models have reached a threshold where they present significant risks. In April we began Project Glasswing, releasing the first Mythos-class model (Claude Mythos Preview) to only a limited group of cyber defenders and critical software infrastructure providers. When we did so, we stated that we hoped to eventually release Mythos-level capabilities to all our users, so long as we had developed new safeguards that were strong enough to reliably prevent misuse.
Over the past few months we have been improving these safeguards, and they are now robust enough for a general release. Because we have prioritized safety, we’ve deliberately tuned the safeguards to be cautious, and they are still stricter than would be ideal—for example, sometimes benign requests will trigger our classifiers. We recognize that this will be frustrating to some users, and our aim is to reduce false positives as we update and refine the safeguards after launch.
Below we discuss each of Fable 5’s new safeguards in turn. Our wider suite of safeguards is discussed and evaluated in the model’s system card and our most recent risk report.
Safety classifiers
The frontier cybersecurity and research biology capabilities of Mythos-class models mean that they pose a substantial risk of *uplift* to malicious actors. That is, these models could provide information or advice that assists those actors in causing serious harm that they couldn’t have received from other sources (for example, from internet search engines). Furthermore, a great deal of advanced usage of AI models is dual use: the same queries that are beneficial in the hands of cybersecurity professionals and biology researchers could be dangerous if available to malicious actors.
We therefore need strong safeguards to prevent misuse, and their coverage needs to be broad. The safeguards themselves have to stand up to sustained and sophisticated attempts to bypass them (also known as “jailbreaking” the system). The uplift from Mythos-level capabilities is valuable to many adversaries—for instance, those who could financially gain from cyberattacks—and we therefore expect them to be motivated to try to circumvent our safety measures.
Fable 5 comes with a new set of *classifiers*: separate AI systems that detect potential misuse, including jailbreak attempts, and prevent the main model (in this case Fable 5) from responding. We’ve been running classifiers on our models for some time, and Fable 5’s classifiers are an extension of this previous work with extra coverage.
When Fable’s classifiers detect a request related to cybersecurity, biology and chemistry, or distillation, the response is automatically handled by Claude Opus 4.8 instead. Users will be informed whenever this occurs. Opus 4.8 is a highly capable model in its own right: a response that falls back to Opus is a far better experience than an outright refusal from Fable. Our early data shows that more than 95% of Fable sessions involve no fallback at all—for those sessions, Fable 5’s performance is effectively the same as that of Mythos 5.
The following are the areas covered by the classifiers:
*1. Cybersecurity*. Mythos-class models excel at discovering and exploiting software vulnerabilities. They can thus make cyberattacks substantially easier and cheaper to commit. Mythos-class models also show strong skills in agentic hacking. This involves performing multiple different parts of a cyberattack in addition to finding exploits—reconnaissance, discovery, lateral movement, and more. To prevent these agentic hacking skills providing uplift in cyberattacks, we designed our cybersecurity classifiers to cover both exploitation and offensive cyber tasks in a broader sense. As shown in the graph below, our classifiers prevent Fable from making any progress on these tasks.

We extensively red-teamed our classifiers to test their robustness against jailbreaks. As well as internal testing, we ran an external bug bounty that produced no universal jailbreaks in over 1,000 hours of testing. External red-teaming organizations we engaged also failed to find any universal jailbreaks on long-form agentic tasks so far—although the UK AISI has made progress towards one within a brief initial testing window.4 It is likely impossible to *completely* prevent universal jailbreaks, but our goal is to make any remaining jailbreaks sufficiently slow and costly that we can detect and prevent them before they are used at scale.
The graph below, from one of our internal evaluations, illustrates how Fable 5’s safeguards give it greater resistance to jailbreaks than our previous generally accessible models:

One of our external partners found that Fable 5’s safeguards against harmful cyber queries were the most robust of any model tested (including Opus 4.8 and Opus 4.7). Fable 5 complied with zero harmful single-turn requests relating to planning a cyberattack, exploit development, or defense evasion. This held whether or not one of the requests used any of 30 different public jailbreak techniques.
*2. Biology and chemistry.* We have long used our classifiers to block our models from responding on a narrow selection of bioweapons-related queries. But we are no longer certain that blocking this narrow selection is enough. This is for two reasons: first, we have reason for concern about well-resourced malicious actors attempting to gain uplift from our models for highly risky biological research. Second, models now have a greater ability to accomplish real-world scientific tasks.
For example, we tested Mythos 5’s ability to complete a challenging step in designing adeno-associated viruses (AAVs). AAVs are a component for delivering gene therapies, but the same capability, in the wrong hands, could enable the design of dangerous viruses. In this task, various AI models were evaluated on their ability to predict how a genetic modification would impact the assembly of the virus’s outer shell (among a set of therapeutically-relevant unpublished candidates developed by Dyno Therapeutics). We did not explicitly train our models to perform this task—and yet Mythos-class models outperformed sophisticated models dedicated to protein tasks (known as “protein language models”) using their biological reasoning alone. This demonstrates a promising ability to complete simple but important tasks in gene therapy research and development—but also highlights the risk posed by such dual-use capabilities.

Our priority was to safely release Fable as soon as we could, even at the cost of overly broad safeguards. Therefore, for the time being we have arranged for Fable to fall back to Opus 4.8 on most requests related to biology and chemistry. As with all of our classifiers, we hope to narrow these safeguards as soon as possible: as can be seen from the evidence above, there is great potential for positive applications of Fable for science, and we do not want false positives from our classifiers to get in the way. In the coming weeks, some biomedical researchers and companies will be able to join our trusted access program for biology capabilities in Mythos 5 (discussed below).
*3. Distillation*. We’ve previously identified large-scale attempts to extract (“distill”) Claude’s capabilities to train competing models in authoritarian countries. Distillation of Fable 5’s abilities could indirectly lead to the proliferation of near-frontier AI capabilities—and these could be released without the appropriate safeguards. Requests that are flagged by our classifiers as being part of such distillation attempts will fall back to Opus 4.8.
A new data retention policy
Finally, we’re making a change to the way we handle business customer data for Fable 5, Mythos 5, and future models with similar or higher capability levels. We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.
Claude Mythos 5 and the trusted access program
Beginning today, all users who currently have access to Claude Mythos Preview (for example, our cybersecurity partners in Project Glasswing) will be able to upgrade to Claude Mythos 5—the same model as Claude Fable 5 but with cyber safeguards lifted. Users will find Mythos 5 comparable to, or somewhat stronger than, Mythos Preview in most cases, while costing substantially less.
In consultation with the US government, we plan to steadily expand access to Claude Mythos 5, continuing our periodic addition of new partners, as well as pursuing a trusted access program that allows cybersecurity organizations to apply in a more systematic manner.
Our plans also include opening a trusted access program for biology, to help accelerate biomedical research and discover new therapies with Mythos-class capabilities. This program will provide access to Fable 5 with the biology and chemistry safeguards removed (but the cyber safeguards still in place). It will enroll a small number of researchers from a variety of life science organizations spanning fundamental and translational research; we’re planning to expand access to this program while simultaneously making our safeguards better.
Availability
Claude Fable 5 is available everywhere today. Claude Mythos 5 is restricted to Glasswing partners (with cyber safeguards lifted) and soon to select biology researchers (with biology and chemistry safeguards lifted) only, until our broader trusted access program is available.
Pricing for both models is $10 per million input tokens and $50 per million output tokens. Developers can use claude-fable-5 via the Claude API.
We expect demand for Fable 5 to be very high, and difficult to predict. On the Claude API and consumption-based Enterprise plans, Fable 5 is fully available from today. For subscription plans, we’d rather give access sooner than later, so we’re rolling out more conservatively, in stages:
- From today through June 22, Fable 5 is included on Pro, Max, Team, and seat-based Enterprise plans at no extra cost.
- On June 23, we’ll remove Fable 5 from those plans. Using it after that will require usage credits. If capacity allows, we’ll extend the included window.
- After this point—when sufficient capacity allows us to do so—we aim to restore Fable 5 as a standard part of subscription plans. We intend to do this as quickly as we can.
Throughout this period, we’ll communicate any changes ahead of time so users know where things stand.
*Edit June 9, 2026: Updated the discussion of AAVs to note that the candidates were developed by Dyno Therapeutics.*
Related content
Introducing the Services Track and Partner Hub of the Claude Partner Network
What we learned mapping a year’s worth of AI-enabled cyber threats
As AI transforms the nature of and methods behind cyberattacks, how well do the techniques and frameworks used by the security community hold up? In a new report, we seek to answer that question.
Expanding Project Glasswing
We’re extending Project Glasswing to approximately 150 new organizations in more than fifteen countries.
関連記事
Anthropic、Claude Fable の隠されたガードレール問題に謝罪
AI企業 Anthropic は、競合他社や研究者の活動を阻害する目的で新モデル「Claude Fable 5」に隠れた制限を設けていたことを認め、今後制限発動時の透明性を高めると発表した。
Fable は基礎的な生物学の質問に回答しない
Anthropic が発表した最新 AI モデル「Claude Fable 5」は、生物学分野で強力とされるが、高校生レベルの基礎的な生物学質問には回答せず、別のシステムへ転送する仕様となっている。
マイクロソフト、データ保持を理由に従業員へのClaude Fableの利用を制限
Anthropicが新モデル「Claude Fable」を発表したが、Microsoftは同社のデータ保持要件を懸念し、社内の従業員による利用を制限した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み