メインコンテンツへスキップ

#ai安全 のAIニュース

15件の記事

Claude Mythosが防御の弱い企業ネットワークを自律的に端から端まで侵害可能

英国AI安全研究所がAnthropicのClaude Mythos Previewをテストした結果、AIモデルが初めて企業ネットワークに対する完全な攻撃シミュレーションを自律的に完了したが、結果には重要な注意点がある。

The Decoder·4月15日·★★★★

OpenAI、児童性的搾取の増加に対処する新たな安全指針を発表

OpenAIがAIの進歩に関連する児童性的搾取の増加に対処するため、新たな児童安全指針を発表した。

TechCrunch AI·4月9日·★★★★

子ども安全ブループリントの紹介

OpenAIが子ども安全ブループリントを発表した。このロードマップは、保護機能、年齢に適した設計、協力体制を通じて、若者をオンラインで保護しエンパワーする責任あるAI構築を目指す。

OpenAI News·4月8日

オーストラリア政府とAnthropic、AI安全と研究に関する覚書に署名

オーストラリア政府とAI企業Anthropicが、AIの安全性向上と研究促進を目的とした覚書に署名した。

Anthropic News·3月31日·★★★★

OpenAI、ティーン向け安全対策のためのオープンソースツールを追加

OpenAIは、開発者がティーン向けにAIをより安全に構築するためのオープンソースツールを提供した。開発者はこれらのポリシーを活用して、ゼロから安全対策を構築する手間を省ける。

TechCrunch AI·3月25日

開発者が青少年向けに安全なAI体験を構築する支援

OpenAIが開発者向けにGPT-OSS-Safeguardを使用したプロンプトベースの青少年安全ポリシーを公開し、AIシステムにおける年齢特有のリスクを軽減する。

OpenAI News·3月24日

Nemotron 3 Content Safety 4B:マルチモーダル・多言語コンテンツモデレーション

NVIDIAが、画像とテキストを同時に分析できるマルチモーダルAIモデル「Nemotron 3 Content Safety 4B」を発表した。このモデルは100言語に対応し、有害コンテンツの自動検出を可能にする。

Hugging Face Blog·3月21日·★★★★

OpenAI Japanが日本におけるティーン安全対策計画を発表、若年層の安全を最優先に

OpenAI Japanは、生成AIを利用するティーン向けに、年齢確認の強化、保護者による管理機能、ウェルビーイング保護策を含む「日本ティーン安全対策計画」を発表した。

OpenAI News·3月17日

Anthropic CEOがOpenAIの国防総省契約を「安全対策の見せかけ」と攻撃、投資家は緊張緩和に奔走

AnthropicのCEOダリオ・アモデイは、OpenAIの国防総省契約を「80%が安全対策の見せかけ」と批判し、同社が政治的忠誠心不足で政権から報復を受けていると主張した。OpenAIは契約を急遽更新し、投資家は緊張緩和を働きかけている。

The Decoder·3月5日·★★★★

OpenAIが法廷でスチュアート・ラッセルを「終末論者」と呼ぶ、CEOは以前そのAI絶滅警告に共同署名

OpenAIが法廷でAI専門家スチュアート・ラッセルを「終末論者」と批判した。同社CEOサム・アルトマンは以前、同じAI絶滅警告に共同署名していた。

The Decoder·2月28日

OpenAI、カナダで銃乱射事件の容疑者の暴力的なチャットを検知しながら警察に通報せず、より厳格な安全プロトコルを約束

OpenAIは、カナダの学校銃乱射事件で、容疑者のアカウントをブロックしたが警察に通報しなかったことを受け、当局との協力ルールを強化すると発表した。

The Decoder·2月28日·★★★★

メンタルヘルス関連取り組みに関する最新情報

OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。

OpenAI News·2月27日

AnthropicがPublic First Actionに2000万ドルを寄付

AI企業Anthropicが政治活動団体Public First Actionに2000万ドルを寄付することを発表しました。

Anthropic News·2月12日·★★★★

Stability AIがテック連合に参加

Stability AIは、オンライン上の児童性的搾取・虐待対策に取り組む主要テック企業のグローバル連合「Tech Coalition」に参加した。

Stability AI·2月12日

LWiAIポッドキャスト #232 - ChatGPT広告、Thinking Machinesのドラマ、STEM

OpenAIがChatGPTに広告を導入する試験を開始。Thinking Machines社の内部問題と、STEM(埋め込みモジュールによるトランスフォーマーの拡張)技術について議論。

Last Week in AI·1月28日·★★★★