#リスク評価のAIニュース

5件の記事

Anthropic 責任あるスケーリングポリシー v3：詳細の掘り下げ

Anthropic は安全基準「RSP」を v2.2 から v3.0 に変更した。本記事は新ポリシーの仕組み、ロードマップ、リスク報告書を評価し、この変更が既存の約束を破った可能性を示唆している。

Anthropicのアライメント科学チームメンバーは、政策立案者にAIの誤配列リスクを実感させるため、脅迫演習の結果を説明した。

OpenAIとGoogle DeepMindの従業員30名以上が、国防総省がAI企業Anthropicをサプライチェーンリスクと指定した訴訟で、同社を支持する声明に署名した。

研究者らは、大規模言語モデル（LLM）を用いたデータセットリスク分析のためのガイド付きフレームワークを提案し、手動監査の課題と完全自動化の限界を克服する。

研究者間で合意がない中、政府はAIの存続危機をどの程度重視すべきか。証拠に基づく政策立案アプローチを示すシリーズの第1報で、危機が推測的である一方、政府は優先順位付けを迫られると指摘する。