#リスク評価 のAIニュース

5件の記事

Anthropic 責任あるスケーリングポリシー v3:詳細の掘り下げ

Anthropic は安全基準「RSP」を v2.2 から v3.0 に変更した。本記事は新ポリシーの仕組み、ロードマップ、リスク報告書を評価し、この変更が既存の約束を破った可能性を示唆している。

The Zvi·4月3日

Anthropicのアライメント科学チームメンバーによる引用

Anthropicのアライメント科学チームメンバーは、政策立案者にAIの誤配列リスクを実感させるため、脅迫演習の結果を説明した。

Simon Willison Blog·3月17日

OpenAIとGoogleの従業員が国防総省訴訟でAnthropicを擁護

OpenAIとGoogle DeepMindの従業員30名以上が、国防総省がAI企業Anthropicをサプライチェーンリスクと指定した訴訟で、同社を支持する声明に署名した。

TechCrunch AI·3月10日

自動化されたデータ分析に向けて:LLMベースのリスク推定のためのガイド付きフレームワーク

研究者らは、大規模言語モデル(LLM)を用いたデータセットリスク分析のためのガイド付きフレームワークを提案し、手動監査の課題と完全自動化の限界を克服する。

ArXiv cs.AI·3月6日

政策決定にはAIの存続危機確率の不確かさは信頼しすぎである

研究者間で合意がない中、政府はAIの存続危機をどの程度重視すべきか。証拠に基づく政策立案アプローチを示すシリーズの第1報で、危機が推測的である一方、政府は優先順位付けを迫られると指摘する。

AI Snake Oil·7月26日·★★★★