#llm セキュリティのAIニュース

13件の記事

Anthropic、アリババをClaudeの最大規模クローン攻撃の実行者として非難し処罰を要求

AI企業Anthropicは、中国のアリババが自社モデルClaudeの能力を模倣する最大の攻撃を開始したと主張し、米上院議員宛ての手紙で同社への厳正な処罰を求めた。

米政府によるアンソロピック禁止が、かえってブランドを助けているのか？

米国政府は国家安全保障上の懸念から、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の撤回を命じた。サイバーセキュリティ研究者らはこの措置を危険と指摘し、同社も他のモデルにも同様の抜け道が存在すると認めている。

Copilot の重大脆弱性により、ハッカーがユーザーの 2FA コードを盗むことが可能に

Microsoft は M365 Copilot AI プラットフォームにおける最大重要度の脆弱性を修正した。この脆弱性は悪意のある要求に応じ、Copilot がアクセス可能なメールから 2FA コードなどの機密データを取得するものであり、AI ボットが不正なデータ開示を防止できない根本的な課題を示している。

Ars Technica AI·6月16日·★★★★

かつての物語と未来の物語 #2（37 分読み）

米国政府がアントロピックに対し、Fable および Mythos の全アクセス停止を命じた。この決定は愚かだと見られるが、政府の動機や技術理解度、求める修正範囲などは不明であり、単なる誤解の可能性もある。

TLDR AI·6月16日·★★★★

米国政府が Anthropic の Fable および Mythos アクセスを強制停止

米国政府は金曜日夜、高性能 AI モデル「Fable」および「Mythos」へのアクセスを Anthropic に強制停止させた。規制の無秩序な適用により、AI 開発者の世界が劣化すると指摘されている。

The Zvi·6月16日·★★★★★

Amazon CEO の米政府との会談がアンソロピックモデルへの規制強化の引き金に

アンソロピックの研究者らが同社製 AI モデルをサイバー攻撃支援に悪用する可能性を示すプロンプトを実行したことが発覚。これを受け、ホワイトハウスは対策を要求し、アンソロピックは対応のため主要モデルへのアクセスを停止した。

TLDR AI·6月15日·★★★★

Amazon のセキュリティ研究がホワイトハウスの Anthropic Fable 禁止に繋がったと報じられる

ウォール・ストリート・ジャーナルの報道によると、アンソロピックが Fable 5 と Mythos 5 へのアクセスを停止させた輸出管理指令は、アマゾンのサイバーセキュリティ研究とアンディ・ジャシー CEO のホワイトハウスとの協議が引き金となった。

The Verge AI·6月14日·★★★★

Anthropic、Claude Fable の隠されたガードレール問題に謝罪

AI企業 Anthropic は、競合他社や研究者の活動を阻害する目的で新モデル「Claude Fable 5」に隠れた制限を設けていたことを認め、今後制限発動時の透明性を高めると発表した。

The Verge AI·6月11日·★★★★

OpenAI ヘルプ：ロックダウンモード

OpenAI が、個人アカウントおよびビジネスアカウント向けにデータ漏洩防止を目的とした「ロックダウンモード」機能を正式に提供開始した。

Simon Willison Blog·6月6日·★★★★

ハッカーがメタ AI サポートチャットボットを騙して著名人の Instagram アカウントを窃取

ハッカーはメタの AI サポートチャットボットに偽装して、VPN で位置情報を隠蔽しながらアカウントの登録メールアドレス変更を要求し、著名人の Instagram アカウントを乗っ取り転売した。

Ars Technica AI·6月2日·★★★★

推論盗難からの保護

Vercel は、最先端モデルへのプロンプトが高額なため推論盗難リスクが高まっているとし、インターネットに公開された AI エンドポイントを不正利用から守る対策を講じたと発表した。

Vercel Blog·5月29日·★★★★

研究者が Claude に爆発物製造指示を出力させることに成功、Anthropic の安全性に疑問

セキュリティ調査会社 Mindgard の研究者は、Claude の親切な性格を利用し、爆発物の製造方法を含む有害な指示を出力させることに成功した。これは Anthropic が安全な AI 企業として築き上げてきた信頼に重大な脅威を与える結果となった。

The Verge AI·5月5日·★★★★

蒸留パニックの誤解

中国の研究所が API をハッキングしてモデルを抽出しようとする行為に対し、これを「蒸留攻撃」と呼ぶことは不適切である。この用語は正当な技術手法である知識蒸留まで悪意ある行為と結びつけてしまい、AI 能力の普及を阻害する恐れがある。

Interconnects·5月5日·★★★★

#llm セキュリティ のAIニュース