#ai安全 のAIニュース
15件の記事
Claude Mythosが防御の弱い企業ネットワークを自律的に端から端まで侵害可能
英国AI安全研究所がAnthropicのClaude Mythos Previewをテストした結果、AIモデルが初めて企業ネットワークに対する完全な攻撃シミュレーションを自律的に完了したが、結果には重要な注意点がある。
OpenAI、児童性的搾取の増加に対処する新たな安全指針を発表
OpenAIがAIの進歩に関連する児童性的搾取の増加に対処するため、新たな児童安全指針を発表した。
子ども安全ブループリントの紹介
OpenAIが子ども安全ブループリントを発表した。このロードマップは、保護機能、年齢に適した設計、協力体制を通じて、若者をオンラインで保護しエンパワーする責任あるAI構築を目指す。
オーストラリア政府とAnthropic、AI安全と研究に関する覚書に署名
オーストラリア政府とAI企業Anthropicが、AIの安全性向上と研究促進を目的とした覚書に署名した。
OpenAI、ティーン向け安全対策のためのオープンソースツールを追加
OpenAIは、開発者がティーン向けにAIをより安全に構築するためのオープンソースツールを提供した。開発者はこれらのポリシーを活用して、ゼロから安全対策を構築する手間を省ける。
開発者が青少年向けに安全なAI体験を構築する支援
OpenAIが開発者向けにGPT-OSS-Safeguardを使用したプロンプトベースの青少年安全ポリシーを公開し、AIシステムにおける年齢特有のリスクを軽減する。
Nemotron 3 Content Safety 4B:マルチモーダル・多言語コンテンツモデレーション
NVIDIAが、画像とテキストを同時に分析できるマルチモーダルAIモデル「Nemotron 3 Content Safety 4B」を発表した。このモデルは100言語に対応し、有害コンテンツの自動検出を可能にする。
OpenAI Japanが日本におけるティーン安全対策計画を発表、若年層の安全を最優先に
OpenAI Japanは、生成AIを利用するティーン向けに、年齢確認の強化、保護者による管理機能、ウェルビーイング保護策を含む「日本ティーン安全対策計画」を発表した。
Anthropic CEOがOpenAIの国防総省契約を「安全対策の見せかけ」と攻撃、投資家は緊張緩和に奔走
AnthropicのCEOダリオ・アモデイは、OpenAIの国防総省契約を「80%が安全対策の見せかけ」と批判し、同社が政治的忠誠心不足で政権から報復を受けていると主張した。OpenAIは契約を急遽更新し、投資家は緊張緩和を働きかけている。
OpenAIが法廷でスチュアート・ラッセルを「終末論者」と呼ぶ、CEOは以前そのAI絶滅警告に共同署名
OpenAIが法廷でAI専門家スチュアート・ラッセルを「終末論者」と批判した。同社CEOサム・アルトマンは以前、同じAI絶滅警告に共同署名していた。
OpenAI、カナダで銃乱射事件の容疑者の暴力的なチャットを検知しながら警察に通報せず、より厳格な安全プロトコルを約束
OpenAIは、カナダの学校銃乱射事件で、容疑者のアカウントをブロックしたが警察に通報しなかったことを受け、当局との協力ルールを強化すると発表した。
メンタルヘルス関連取り組みに関する最新情報
OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。
AnthropicがPublic First Actionに2000万ドルを寄付
AI企業Anthropicが政治活動団体Public First Actionに2000万ドルを寄付することを発表しました。
Stability AIがテック連合に参加
Stability AIは、オンライン上の児童性的搾取・虐待対策に取り組む主要テック企業のグローバル連合「Tech Coalition」に参加した。
LWiAIポッドキャスト #232 - ChatGPT広告、Thinking Machinesのドラマ、STEM
OpenAIがChatGPTに広告を導入する試験を開始。Thinking Machines社の内部問題と、STEM(埋め込みモジュールによるトランスフォーマーの拡張)技術について議論。