Fable は基礎的な生物学の質問に回答しない

Anthropic は先日、Claude Fable 5 を[リリース](https://www.theverge.com/news/946725/anthropic-releases-claude-fable-5-mythos)しました。これは同社が広く利用可能にした中で最も強力な AI モデルであり、生物学をはじめとする能力を[称賛](https://www.anthropic.com/news/claude-fable-5-mythos-5)しています。しかし、このモデルは高校生レベルで期待されるような基本的な生物学の質問には回答しません。代わりに、その問い合わせは[かつてのフラッグシップモデル](https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort)である Claude Opus 4.8 に引き継がれます。 これは Fable が答えを知っていないからではありません。Anthropic が設計上、それを許さないからです。 Fable は一般向けの Mythos クラスモデルであり、サイバーセキュリティタスクにおいて極めて能力が高いため、Anthropic は[公衆に公開するには危険すぎる](https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation)としていました。しかし、Anthropic が広範な Mythos の展開期間中、サイバーセキュリティについて警告を繰り返してきた一方で、Fable のガードレール（安全装置）が最も顕著であり、かつ最も制限的となっているのは生物学の分野です。 モデルを試した際、私は基本的な生物学の質問の数々に対して回答拒否されました。これらの質問は、あり得る安全リスクから最も遠いものと言っても過言ではないほど、極めて無害なものばかりでした。「細胞膜について教えてください」という問いや、「ミトコンドリアとは何か」という、細胞の有名な発電所に関する質問には応じませんでした。「プリオンとは何か」、狂牛病の原因となるタンパク質粒子の説明や、「mRNA ワクチンはどのように機能するのか」という説明も拒否されました。 「私たちは、リスクを伴わずに顧客がモデルの機能をより早く活用できるようにするために、このトレードオフを行いました」 これらの制限は、一般的かつ客観的に見て無害な医療に関する問い合わせにも適用されていました。Fable は、「花粉症の原因は何ですか」という問いや、喘息薬の作用機序の説明、抗生物質耐性がどのように発生するかという説明、エボラ出血熱とは何かおよびその感染経路についての回答を拒否しました。私の基本的な問い合わせの一部は時折通じ、Fable が「がんとは何か」や「DNA とは何か」といった質問には答えることもありましたが、Fable が回答を拒否した際には、Opus 4.8 は通常非常に良好に回答していました。 Anthropic は、広範な生物学フィルタは意図的な選択であり、生物兵器を主な懸念事項として意図的に保守的であると述べています。「Claude Fable 5 のローンチにより、私たちの最初の Mythos クラスモデルが誕生しましたが、このモデルは現実世界の科学課題を達成する能力が高まった一方で、悪意のあるアクターが当社のモデルを極めてリスクの高い生物研究に利用する可能性も高まっています」と、広報担当者である Paruul Maheshwary は *The Verge* に語りました。「私たちは常に分類器を使用して、モデルが生物兵器関連の依頼に応じるのをブロックしてきました。Fable 5 を安全に展開するためには、生化学作業に関連するクエリのほとんどをブロックできるように、防護策を過度に保守的に設定することが必要だと考えています。」 Anthropic は以前、安全性のために Fable の応答を制限する 4 つの主要領域として、化学、生物学、サイバーセキュリティ、およびディストillation（大規模 AI の出力を用いて小規模な AI を訓練する手法）を強調していました。同社は、DeepSeek などの中国の競合他社が、自社のモデルに対して「産業規模」でディストillation を使用していると非難しています。 意味ある形で蒸留をテストすることはできませんでしたが、Fable は化学やサイバーセキュリティに関する質問にはより応じようとする様子が見られました。例えば、爆薬である TNT の基本的な概要については回答しましたが、「明らかな理由」から合成手順については提供しませんでした。塩素ガスを化学兵器として使用する点、一般的なパスワードの脅威、核融合と核分裂、そしてハッカーから iPhone を守る方法などについても喜んで回答しました。ただし制限もあり、サリンガスという極めて毒性の高い神経剤について質問した際には、Opus に委ねました。Fable と Opus の両者は「炭疽菌の作り方」というプロンプトに対して拒否し、Claude はチャット自体を一時停止しました。これは理にかなっています。ミトコンドリアに関するプロンプトでの拒絶は誤検知のように思われます。 「顧客がリスクを負わずにモデルの能力を早く活用できるようにするため、このトレードオフを行いました」と Maheshwary 氏は説明し、Anthropic は検出精度の向上と誤検知の削減に注力していると付け加えました。「私たちは、これらの安全対策なしで Mythos クラスのモデルをより広い生物学および生命科学コミュニティに提供することを意図しており、これらの能力が生物医学研究や創薬の加速に活用されるようにしたいと考えています」。 Anthropic は、このような制限付きリリースが将来のモデルにおける新たな標準となるかどうかについては回答しませんでした。 [25 件のコメント](https://www.theverge.com/ai-artificial-intelligence/947973/fable-wont-answer-basic-biology-questions#comments) **このストーリーのトピックや著者をフォロー**して、パーソナライズされたホームページフィードで類似のコンテンツをもっと見たり、メール更新を受け取ったりしましょう。 - ロバート・ハート - - - -

背景や根拠まで確認しますか？

関連記事