メインコンテンツへスキップ

#ガードレール のAIニュース

6件の記事

AI ブラウザの新たな攻撃手法が示すリスクと問題点

Ars Technica は、AI ブラウザの開発者が大規模言語モデルへの指示を混同させるリスクについて警告しており、単なるプロンプトでの操作が機密情報の漏洩や意図しない行動を引き起こす可能性があると指摘している。

Ars Technica AI·7月1日·★★★★

間接プロンプトインジェクションに関する洞察(12 分読了)

TLDR AI が、AI モデルが外部データから悪意ある指示を誤って受け取る「間接プロンプトインジェクション」の仕組みと対策について解説した。

TLDR AI·6月24日·★★★★

米政府によるアンソロピック禁止が、かえってブランドを助けているのか?

米国政府は国家安全保障上の懸念から、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の撤回を命じた。サイバーセキュリティ研究者らはこの措置を危険と指摘し、同社も他のモデルにも同様の抜け道が存在すると認めている。

TechCrunch AI·6月20日·★★★★

サイバーセキュリティ研究者らがアンソロピックの「Fable」におけるガードレールに不満を表明

サイバーセキュリティ研究者が、AI 企業アンソロピックが提供する「Fable」プラットフォームに課された安全対策(ガードレール)の制限について、その厳格さや実用性に不満を表明している。

TechCrunch AI·6月11日

Amazon Bedrock Guardrailsで年齢対応・文脈認識AIを構築

Amazonは、生成AIアプリケーションの安全性と信頼性を高めるため、ユーザーの年齢や文脈に応じた適切な応答を保証する「Bedrock Guardrails」を開発した。

AWS Machine Learning Blog·3月27日·★★★★

Sonatype、AI支援コード生成の安全性向上ガイドを発表

Sonatypeは、AIコーディングツールとオープンソースエコシステムの間に位置するリアルタイムガードレールシステム「Sonatype Guide」を発表した。このシステムは、AI生成コードが安全で有効かつ保守可能な依存関係を使用することを保証する。

InfoQ·3月21日