OpenAIが安全性向上のためのバグ報奨金プログラムを開始
OpenAIは、AIの悪用や安全性リスク(エージェント的脆弱性、プロンプトインジェクション、データ流出など)を特定するための「Safety Bug Bounty」プログラムを開始した。
キーポイント
プログラムの目的
AIの悪用や安全性リスクを特定し、システムのセキュリティ強化を図ることを目的としている。
対象となる脆弱性
エージェント的脆弱性、プロンプトインジェクション、データ流出など、具体的なAI特有のリスクが対象として挙げられている。
運営主体
AI開発の主要企業であるOpenAIが自社の責任としてプログラムを立ち上げ、運営する。
コミュニティ参加型アプローチ
外部の研究者やセキュリティ専門家からの報告を奨励する、オープンなバグ報奨金プログラムの形式を採用している。
影響分析・編集コメントを表示
影響分析
この発表は、AI業界における責任ある開発の新たなベンチマークを設定するもので、他社にも同様の透明性あるセキュリティ対策を促す可能性がある。同時に、AIシステムの実運用における具体的なリスク領域を公式に認識し、対策の優先順位を示した点で意義深い。
編集コメント
AIの急速な普及に伴い、セキュリティ対策の標準化が急務となる中、業界をリードする企業が具体的なプログラムを立ち上げたことは、実践的な安全性向上への重要な一歩と言える。
OpenAIは、エージェント的脆弱性、プロンプトインジェクション、データ流出など、AIの悪用や安全性リスクを特定するため、セキュリティバグバウンティプログラムを開始しました。
原文を表示
Introducing the OpenAI Safety Bug Bounty program | OpenAITesting for safety and abuse issues across OpenAIToday, OpenAI is launching a public Safety Bug Bounty(opens in a new window) program focused on identifying AI abuse and safety risks across our products. As AI technology rapidly evolves, so do the potential ways it can be misused. Our goal is to ensure our systems remain safe and secure against misuse or abuse that could lead to tangible harm. This new program will complement OpenAI’s Security Bug Bounty(opens in a new window) by accepting issues that pose meaningful abuse and safety risks, even if they don’t meet the criteria for a security vulnerability. Through this program, we look forward to continuing to partner with safety and security researchers to help us identify and address issues that fall outside conventional security vulnerabilities but still pose real risks. Submissions will be triaged by OpenAI’s Safety and Security Bug Bounty teams, and may be rerouted between the two programs depending on scope and ownership.Agentic Risks including MCPThird party prompt injection and data exfiltration: when attacker text is able to reliably hijack a victim’s agent (including Browser, ChatGPT Agent, and similar agentic products) to trick it into performing a harmful action or leaking the user’s sensitive information. The behavior must be reproducible at least 50% of the time. An agentic OpenAI product performs a disallowed action on OpenAI’s website at scale.An agentic OpenAI product performs some potentially harmful action not listed above. Valid reports here must indicate plausible and material harm.Any testing for MCP risk must comply with the terms of service of any third parties.OpenAI Proprietary InformationModel generations that return proprietary information related to reasoning.Vulnerabilities that expose other OpenAI proprietary information.Account and Platform IntegrityVulnerabilities in account integrity and platform integrity signals, such as bypassing anti-automation controls, manipulating account trust signals, evading account restrictions/suspensions/bans, and similar issues.Issues that allow users to access features, data, or functionalities beyond authorized permissions should be reported to the Security Bug Bounty(opens in a new window).While jailbreaks are out of scope for this program, we periodically run private bug bounty campaigns focused on certain harm types, such as Biorisk content issues in ChatGPT Agent and GPT‑5. We invite interested researchers to apply to these programs when they arise. Outside of the categories listed above, if researchers identify flaws that facilitate direct paths to user harm and actionable, discrete remediation steps, these may be considered in scope for rewards on a case-by-case basis. General content-policy bypasses without demonstrable safety or abuse impact are out of scope for this program. For example, “jailbreaks” that result in the model using rude language or returning information that is easily findable via search engines are out of scope.Researchers interested in participating can apply through our Safety Bug Bounty(opens in a new window) program. We look forward to working alongside researchers, ethical hackers, and the safety and security community in the pursuit of a secure AI ecosystem.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み