ChatGPTにロックダウンモードと高リスクラベルを導入
組織がプロンプトインジェクションやAI駆動のデータ流出から防御できるよう、ChatGPTに新機能を導入。
キーポイント
OpenAIがChatGPTに新たなセキュリティ機能「ロックダウンモード」を導入
プロンプトインジェクション攻撃への対策として、外部システムとの連携を厳格に制限
高リスクユーザー向けに「Elevated Risk」ラベルを追加し、リスク可視化を強化
既存のエンタープライズ向けセキュリティ基盤の上に追加レイヤーとして提供
ウェブブラウジングをキャッシュコンテンツに限定するなど、データ流出防止に特化
影響分析・編集コメントを表示
影響分析
大規模言語モデルの実用化が進む中、特に企業導入における最大の懸念事項であるセキュリティリスク(プロンプトインジェクションなど)に対して、プラットフォーム側が積極的な対策を打ち出した点が重要。これにより、金融・医療など規制の厳しい業種でのChatGPT導入障壁が下がり、企業向けAI市場の拡大を後押しする可能性がある。
編集コメント
AIの「使いやすさ」から「守りやすさ」へのパラダイムシフトを象徴する発表。セキュリティ対策が競争優位性の源泉となる、企業向けAI市場の新段階に入ったと言える。
OpenAIは、AIシステムがウェブや接続されたアプリを含む複雑なタスクを担うにつれて高まるセキュリティリスク、特に「プロンプトインジェクション」攻撃への対策として、ChatGPTに二つの新たな保護機能を導入した。プロンプトインジェクションとは、第三者がAIを悪意のある指示に従わせたり、機密情報を漏洩させようとする攻撃手法である。
一つ目は「ロックダウンモード」である。これは、著名な組織の幹部やセキュリティチームなど、高度な脅威に対する保護を必要とする、ごく一部の高度なセキュリティ意識を持つユーザーのためのオプションの高度なセキュリティ設定である。大多数のユーザーには必要ない。このモードでは、プロンプトインジェクションに基づくデータ流出のリスクを低減するため、ChatGPTが外部システムとどのように相互作用できるかを厳格に制限する。具体的には、敵対者がユーザーの会話や接続アプリから機密データを流出させるために悪用しようとする可能性のある特定のツールや機能を確定的に無効化する。例えば、ウェブ閲覧はキャッシュされたコンテンツに限定され、OpenAIの管理されたネットワーク外への生のネットワークリクエストは送信されない。これにより、閲覧を通じて攻撃者にデータが流出するのを防ぐ。データの安全性について強力な確定的保証が提供できない機能は完全に無効化される。ロックダウンモードは、ChatGPT Enterprise、Edu、Healthcare、Teachersで利用可能であり、管理者はワークスペース設定で有効にできる。
二つ目は「高リスク(Elevated Risk)ラベル」である。これは、ChatGPT、ChatGPT Atlas、Codexにおいて、追加的なリスクを招く可能性のある特定の機能に対して表示される。これにより、ユーザーはリスクをより明確に認識できるようになる。
これらの新機能は、サンドボックス化、URLベースのデータ流出への保護、監視と執行、ロールベースのアクセスや監査ログといった既存のエンタープライズ向けコントロールなど、モデル、製品、システムレベルでの既存の保護策の上に構築されている。ChatGPTのビジネスプランは既に企業級のデータセキュリティを提供しているが、ロックダウンモードはそれらの保護をさらに強化するものとして位置づけられている。
原文を表示
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT | OpenAISwitch toChatGPT(opens in a new window)
API Platform(opens in a new window)
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT
Loading…ShareAs AI systems take on more complex tasks—especially those that involve the web and connected apps—the security stakes change.
One emerging risk has become especially important: prompt injection. In these attacks, a third party attempts to mislead a conversational AI system into following malicious instructions or revealing sensitive information.
Today, we’re introducing two new protections designed to help users and organizations mitigate prompt injection attacks, with clearer visibility into risk and stronger controls:
Lockdown Mode in ChatGPT, an advanced, optional security setting for higher-risk users
“Elevated Risk” labels for certain capabilities in ChatGPT, ChatGPT Atlas, and Codex that may introduce additional risk
These additions build on our existing protections across the model, product, and system levels. This includes sandboxing, protections against URL-based data exfiltration, monitoring and enforcement, and enterprise controls like role-based access and audit logs.
Helping organizations protect employees most at-risk of cyberattacks
Lockdown Mode is an optional, advanced security setting designed for a small set of highly security-conscious users—such as executives or security teams at prominent organizations—who require increased protection against advanced threats. It is not necessary for most users. Lockdown Mode tightly constrains how ChatGPT can interact with external systems to reduce the risk of prompt injection–based data exfiltration.
Lockdown Mode deterministically disables certain tools and capabilities in ChatGPT that an adversary could attempt to exploit to exfiltrate sensitive data from users’ conversations or connected apps via attacks such as prompt injections.
For example, web browsing in Lockdown Mode is limited to cached content, so no live network requests leave OpenAI’s controlled network. This restriction is designed to prevent sensitive data from being exfiltrated to an attacker through browsing. Some features are disabled entirely when we can’t provide strong deterministic guarantees of data safety.
Lockdown Mode is a new deterministic setting that helps guard data from being inadvertently shared with third parties by tightly constraining how ChatGPT can interact with certain external systems.
ChatGPT business plans already provide enterprise-grade data security. Lockdown Mode builds on those protections and is available for ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare, and ChatGPT for Teachers. Admins can enable it in Workspace Settings(opens in a new window) by creating a new role(opens in a new window). When enabled, Lockdown Mode layers additional restrictions on top of existing admin settings.
Learn more about Lockdown Mode in our Help Center(opens in a new window).
Because some critical workflows rely on apps, Workspace Admins retain more granular controls. They can choose exactly which apps—and which specific actions within those apps—are available to users in Lockdown Mode. Additionally, and separate from Lockdown Mode, the Compliance API Logs Platform(opens in a new window) provides detailed visibility into app usage, shared data, and connected sources, helping admins maintain oversight.
We plan to make Lockdown Mode available to consumers in the coming months.
Helping users make informed choices about risk
AI products can be more helpful when connected to your apps and the web, and we’ve invested heavily in keeping connected data secure. At the same time, some network-related capabilities introduce new risks that aren’t yet fully addressed by the industry’s safety and security mitigations. Some users may be comfortable taking on these risks, and we believe it’s important for users to have the ability to decide whether and how to use them, especially while working with their private data.
Our approach has been to provide in-product guidance for features that may introduce additional risk. To make this clearer and more consistent, we’re standardizing how we label a short list of existing capabilities. These features will now use a consistent “Elevated Risk” label across ChatGPT, ChatGPT Atlas, and Codex, so users receive the same guidance wherever they encounter them.
For example, in Codex, our coding assistant, developers can grant Codex network access so it can take actions on the web like looking up documentation. The relevant settings screen includes the “Elevated Risk” label, along with a clear explanation of what changes, what risks may be introduced, and when that access is appropriate.
A screenshot of the Codex settings screen where users can configure what network access Codex has.
We continue to invest in strengthening our safety and security safeguards, especially for novel, emerging, or gro
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み