#責任あるai のAIニュース
23件の記事
AnthropicのClaude Opus 4.7、コーディングで大きな進歩を達成、一方でサイバーセキュリティ機能を意図的に縮小
Anthropicが新フラッグシップモデルClaude Opus 4.7を発表した。同モデルはコーディングタスクで大幅な改善を実現したが、訓練中に特定のサイバーセキュリティ機能を意図的に低減させた。
責任ある安全なAIの活用
OpenAIがChatGPTなどのAIツールを安全・正確・透明性を持って責任ある方法で使用するためのベストプラクティスを提供している。
AnthropicのProject Glasswingはモデル悪用防止に不十分かもしれない
Anthropicは、AIのコード生成能力向上と技術の潜在的な脅威への懸念に対応するProject Glasswingを発表したが、モデル悪用防止には不十分との指摘がある。
GPT-2からClaude Mythosへ:『公開には危険すぎる』とされたAIモデルの復活
OpenAIは7年前に言語モデルGPT-2を「公開には危険すぎる」と宣言した。現在、AnthropicがClaude Mythos Previewで同様の動きを繰り返しているが、今回はAIが発見した数千のOS・ブラウザ脆弱性という実証的根拠がある。
子ども安全ブループリントの紹介
OpenAIが子ども安全ブループリントを発表した。このロードマップは、保護機能、年齢に適した設計、協力体制を通じて、若者をオンラインで保護しエンパワーする責任あるAI構築を目指す。
AnthropicのProject Glasswing - Claude Mythosをセキュリティ研究者に限定提供 - は必要だと考える
Anthropicは最新モデルClaude Mythosを一般公開せず、新たに発表したProject Glasswingを通じて限定されたプレビューパートナーにのみ提供した。同社はこのモデルがサイバーセキュリティ研究能力を備えた汎用モデルだと主張している。
マイクロソフトの利用規約によると、Copilotは「娯楽目的のみ」
マイクロソフトは、AIツールCopilotの利用規約で「娯楽目的のみ」と明記し、AI企業自身がユーザーにモデルの出力を盲信しないよう警告している。
責任を持ってエージェントを活用する
Vercel社が、コーディングエージェントが生成するコードを無批判にデプロイすると悪い前提を本番環境に直接送り込む危険があると指摘し、厳格な判断と責任あるフレームワークの必要性を公開した。
Amazon Bedrock Guardrailsで年齢対応・文脈認識AIを構築
Amazonは、生成AIアプリケーションの安全性と信頼性を高めるため、ユーザーの年齢や文脈に応じた適切な応答を保証する「Bedrock Guardrails」を開発した。
OpenAIが安全性向上のためのバグ報奨金プログラムを開始
OpenAIは、AIの悪用や安全性リスク(エージェントの脆弱性、プロンプトインジェクション、データ流出など)を特定するため、安全性向上のためのバグ報奨金プログラムを開始した。
OpenAI、ティーン向け安全対策のためのオープンソースツールを追加
OpenAIは、開発者がティーン向けにAIをより安全に構築するためのオープンソースツールを提供した。開発者はこれらのポリシーを活用して、ゼロから安全対策を構築する手間を省ける。
QCon London 2026:倫理的AIはエンジニアリングの問題である
BBVAの責任あるAIプログラムリードであるクララ・イゲラが、AIシステムに関連する多くのリスクは、純粋なガバナンスや政策問題ではなく、根本的にエンジニアリングの課題であると発表した。
AnthropicがAIの社会・安全保障への影響を研究する内部シンクタンクを設立
AI企業Anthropicは、強力なAIが社会・経済・安全保障に与える影響を研究するための内部シンクタンク「Anthropic Institute」を設立した。
YouTube、政治家・政府関係者・ジャーナリスト向けAIディープフェイク検出機能を拡大
YouTubeは、AIディープフェイク検出ツールを政治家、政府関係者、ジャーナリストに提供し、無許可の人物の肖像使用を削除申請できるようにした。
生成AIを税金申告に信用するな――人命に関わる場面でも信用するな
専門家が、生成AIは根本的な設計上、税金申告や人命に関わる判断に信用できないと警告している。
プレゼンテーション:AIにおけるプライバシーとセキュリティの神話を打ち破り、現実を受け入れる
キャサリン・ジャーミュルが、AIにおけるプライバシーとセキュリティに関する一般的な神話について基調講演し、より安全でプライベートなAIシステムを構築するための設計パターンを探求した。
AIは既に事故で人を殺しているのか?
タイラー・オースティン・ハーパー記者が、イランで150人近い学童が死亡した誤爆がAIの結果である可能性を指摘した。
Anthropicが自らに仕掛けた罠
Anthropic、OpenAI、Google DeepMindなどのAI企業は責任あるガバナンスを約束してきたが、規制の不在により自らを守る術がほとんどない状況にある。
メンタルヘルス関連取り組みに関する最新情報
OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。
ダリオ・アモデイからの歴史的声明
アンソロピックCEOのダリオ・アモデイが、AI安全性と規制に関する歴史的声明を発表した。
Anthropicの責任あるスケーリング方針:バージョン3.0
AnthropicがAI開発の安全性と責任を重視するスケーリング方針の第3版を発表。AIのリスク管理と倫理的展開を強化。
最先端のサイバーセキュリティ能力を防御側に提供する
最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。
クリス・リデルがAnthropicの取締役会に任命
クリス・リデルがAI企業Anthropicの取締役会に任命された。