#責任あるai のAIニュース

23件の記事

AnthropicのClaude Opus 4.7、コーディングで大きな進歩を達成、一方でサイバーセキュリティ機能を意図的に縮小

Anthropicが新フラッグシップモデルClaude Opus 4.7を発表した。同モデルはコーディングタスクで大幅な改善を実現したが、訓練中に特定のサイバーセキュリティ機能を意図的に低減させた。

The Decoder·4月17日

責任ある安全なAIの活用

OpenAIがChatGPTなどのAIツールを安全・正確・透明性を持って責任ある方法で使用するためのベストプラクティスを提供している。

OpenAI News·4月10日

AnthropicのProject Glasswingはモデル悪用防止に不十分かもしれない

Anthropicは、AIのコード生成能力向上と技術の潜在的な脅威への懸念に対応するProject Glasswingを発表したが、モデル悪用防止には不十分との指摘がある。

AI Business·4月9日

GPT-2からClaude Mythosへ：『公開には危険すぎる』とされたAIモデルの復活

OpenAIは7年前に言語モデルGPT-2を「公開には危険すぎる」と宣言した。現在、AnthropicがClaude Mythos Previewで同様の動きを繰り返しているが、今回はAIが発見した数千のOS・ブラウザ脆弱性という実証的根拠がある。

The Decoder·4月8日·★★★★

子ども安全ブループリントの紹介

OpenAIが子ども安全ブループリントを発表した。このロードマップは、保護機能、年齢に適した設計、協力体制を通じて、若者をオンラインで保護しエンパワーする責任あるAI構築を目指す。

OpenAI News·4月8日

AnthropicのProject Glasswing - Claude Mythosをセキュリティ研究者に限定提供 - は必要だと考える

Anthropicは最新モデルClaude Mythosを一般公開せず、新たに発表したProject Glasswingを通じて限定されたプレビューパートナーにのみ提供した。同社はこのモデルがサイバーセキュリティ研究能力を備えた汎用モデルだと主張している。

Simon Willison Blog·4月8日·★★★★

マイクロソフトの利用規約によると、Copilotは「娯楽目的のみ」

マイクロソフトは、AIツールCopilotの利用規約で「娯楽目的のみ」と明記し、AI企業自身がユーザーにモデルの出力を盲信しないよう警告している。

TechCrunch AI·4月6日

責任を持ってエージェントを活用する

Vercel社が、コーディングエージェントが生成するコードを無批判にデプロイすると悪い前提を本番環境に直接送り込む危険があると指摘し、厳格な判断と責任あるフレームワークの必要性を公開した。

Vercel Blog·3月31日·★★★★

Amazon Bedrock Guardrailsで年齢対応・文脈認識AIを構築

Amazonは、生成AIアプリケーションの安全性と信頼性を高めるため、ユーザーの年齢や文脈に応じた適切な応答を保証する「Bedrock Guardrails」を開発した。

AWS Machine Learning Blog·3月27日·★★★★

OpenAIが安全性向上のためのバグ報奨金プログラムを開始

OpenAIは、AIの悪用や安全性リスク（エージェントの脆弱性、プロンプトインジェクション、データ流出など）を特定するため、安全性向上のためのバグ報奨金プログラムを開始した。

OpenAI News·3月25日·★★★★

OpenAI、ティーン向け安全対策のためのオープンソースツールを追加

OpenAIは、開発者がティーン向けにAIをより安全に構築するためのオープンソースツールを提供した。開発者はこれらのポリシーを活用して、ゼロから安全対策を構築する手間を省ける。

TechCrunch AI·3月25日

QCon London 2026：倫理的AIはエンジニアリングの問題である

BBVAの責任あるAIプログラムリードであるクララ・イゲラが、AIシステムに関連する多くのリスクは、純粋なガバナンスや政策問題ではなく、根本的にエンジニアリングの課題であると発表した。

InfoQ·3月24日

AnthropicがAIの社会・安全保障への影響を研究する内部シンクタンクを設立

AI企業Anthropicは、強力なAIが社会・経済・安全保障に与える影響を研究するための内部シンクタンク「Anthropic Institute」を設立した。

The Decoder·3月12日

YouTube、政治家・政府関係者・ジャーナリスト向けAIディープフェイク検出機能を拡大

YouTubeは、AIディープフェイク検出ツールを政治家、政府関係者、ジャーナリストに提供し、無許可の人物の肖像使用を削除申請できるようにした。

TechCrunch AI·3月10日

生成AIを税金申告に信用するな――人命に関わる場面でも信用するな

専門家が、生成AIは根本的な設計上、税金申告や人命に関わる判断に信用できないと警告している。

Andrej Karpathy 厳選·3月6日·★★★★

プレゼンテーション：AIにおけるプライバシーとセキュリティの神話を打ち破り、現実を受け入れる

キャサリン・ジャーミュルが、AIにおけるプライバシーとセキュリティに関する一般的な神話について基調講演し、より安全でプライベートなAIシステムを構築するための設計パターンを探求した。

InfoQ·3月2日

AIは既に事故で人を殺しているのか？

タイラー・オースティン・ハーパー記者が、イランで150人近い学童が死亡した誤爆がAIの結果である可能性を指摘した。

Andrej Karpathy 厳選·3月2日

Anthropicが自らに仕掛けた罠

Anthropic、OpenAI、Google DeepMindなどのAI企業は責任あるガバナンスを約束してきたが、規制の不在により自らを守る術がほとんどない状況にある。

TechCrunch AI·3月1日

メンタルヘルス関連取り組みに関する最新情報

OpenAIが、ペアレンタルコントロール、信頼できる連絡先、苦痛検知の改善、最近の訴訟動向を含むメンタルヘルス安全対策の進捗を共有した。

OpenAI News·2月27日

ダリオ・アモデイからの歴史的声明

アンソロピックCEOのダリオ・アモデイが、AI安全性と規制に関する歴史的声明を発表した。

Andrej Karpathy 厳選·2月27日

Anthropicの責任あるスケーリング方針：バージョン3.0

AnthropicがAI開発の安全性と責任を重視するスケーリング方針の第3版を発表。AIのリスク管理と倫理的展開を強化。

Anthropic News·2月24日·★★★★

最先端のサイバーセキュリティ能力を防御側に提供する

最先端のサイバーセキュリティ技術を防御側に提供し、脅威に対抗する能力を強化する取り組みについて。

Anthropic News·2月20日·★★★★

クリス・リデルがAnthropicの取締役会に任命

クリス・リデルがAI企業Anthropicの取締役会に任命された。

Anthropic News·2月13日