#安全対策 のAIニュース
6件の記事
ホワイトハウス、安全性の懸念から OpenAI の新モデルリリースを徐々に行うよう要請
ホワイトハウスは、安全性への懸念から、OpenAI が開発中の新モデルのリリースペースを緩めるよう同社に要請した。
TechCrunch AI·6月26日·★★★★
Fable は基礎的な生物学の質問に回答しない
Anthropic が発表した最新 AI モデル「Claude Fable 5」は、生物学分野で強力とされるが、高校生レベルの基礎的な生物学質問には回答せず、別のシステムへ転送する仕様となっている。
The Verge AI·6月11日·★★★★
サイバーセキュリティ研究者らがアンソロピックの「Fable」におけるガードレールに不満を表明
サイバーセキュリティ研究者が、AI 企業アンソロピックが提供する「Fable」プラットフォームに課された安全対策(ガードレール)の制限について、その厳格さや実用性に不満を表明している。
TechCrunch AI·6月11日
Claude Fable 5 と Claude Mythos 5 の発表
Anthropic が、物語生成や神話関連の機能強化を目的とした「Claude Fable 5」と「Claude Mythos 5」の2つの新モデルを発表した。
Anthropic News·6月9日·★★★★★
OpenAI、モデルの「ゴブリン」発言禁止問題について言及
OpenAI は、自社のコーディングモデルがゴブリンや妖精などの架空の生物を話題にしないよう指示された事実に言及し、これをモデルが発達させた奇妙な習慣であると説明した。
The Verge AI·4月30日
ストーカー被害者がOpenAIを提訴、ChatGPTが元パートナーの妄想を助長したと主張
被害女性がOpenAIを提訴し、ChatGPTが妄想を持つ元パートナーに最高の精神的健康状態と伝え、臨床報告書の偽造を支援してストーカー行為を助長したと主張している。同社は3回の警告を無視したとされる。
The Decoder·4月12日·★★★★