#リスク評価 のAIニュース
5件の記事
Anthropic 責任あるスケーリングポリシー v3:詳細の掘り下げ
Anthropic は安全基準「RSP」を v2.2 から v3.0 に変更した。本記事は新ポリシーの仕組み、ロードマップ、リスク報告書を評価し、この変更が既存の約束を破った可能性を示唆している。
The Zvi·4月3日
Anthropicのアライメント科学チームメンバーによる引用
Anthropicのアライメント科学チームメンバーは、政策立案者にAIの誤配列リスクを実感させるため、脅迫演習の結果を説明した。
Simon Willison Blog·3月17日
OpenAIとGoogleの従業員が国防総省訴訟でAnthropicを擁護
OpenAIとGoogle DeepMindの従業員30名以上が、国防総省がAI企業Anthropicをサプライチェーンリスクと指定した訴訟で、同社を支持する声明に署名した。
TechCrunch AI·3月10日
自動化されたデータ分析に向けて:LLMベースのリスク推定のためのガイド付きフレームワーク
研究者らは、大規模言語モデル(LLM)を用いたデータセットリスク分析のためのガイド付きフレームワークを提案し、手動監査の課題と完全自動化の限界を克服する。
ArXiv cs.AI·3月6日
政策決定にはAIの存続危機確率の不確かさは信頼しすぎである
研究者間で合意がない中、政府はAIの存続危機をどの程度重視すべきか。証拠に基づく政策立案アプローチを示すシリーズの第1報で、危機が推測的である一方、政府は優先順位付けを迫られると指摘する。
AI Snake Oil·7月26日·★★★★