GitHub Copilotのインタラクションデータ利用ポリシー更新
GitHubは4月24日から、Copilot Free/Pro/Pro+ユーザーの対話データ(入力・出力・コードスニペット・関連コンテキスト)をAIモデル訓練に使用する方針を更新し、オプトアウト可能としたが、Copilot Business/Enterpriseユーザーは対象外である。
キーポイント
データ使用方針の変更
GitHub Copilotの無料版・有料版(Pro/Pro+)ユーザーの対話データをAIモデル訓練に使用する方針を更新し、オプトアウト可能とした。
対象外のユーザー
Copilot BusinessとCopilot Enterpriseユーザーはこの変更の影響を受けず、企業所有リポジトリのデータは使用されない。
収集データの範囲
ユーザーが受け入れた/修正した出力、Copilotへの入力(コードスニペット)、カーソル位置周辺のコードコンテキスト、コメント・ドキュメント、ファイル名・リポジトリ構造・ナビゲーションパターン、Copilot機能との対話、提案へのフィードバック(賛成/反対評価)が含まれる。
使用されないデータ
オプトアウトしたユーザーのデータ、Copilot Business/Enterpriseのデータ、企業所有リポジトリのデータ、非公開リポジトリの静止状態のコンテンツは使用されない。
データ共有と目的
収集データはGitHubの関連会社(Microsoftを含む)と共有される可能性があるが、第三者のAIモデルプロバイダーとは共有されず、モデル性能向上とより正確で安全なコード提案の実現を目的としている。
影響分析・編集コメントを表示
影響分析
この方針変更は、AI支援開発ツールの進化において実世界データの重要性を強調し、ユーザーのプライバシー選択権を維持しながらモデル性能向上を図る業界トレンドを示している。企業ユーザーへの配慮とデータ保護の明確な区別は、企業導入における懸念を軽減する効果がある。
編集コメント
AI開発における実データ活用とユーザープライバシーのバランスを探る重要な事例。企業向けと個人向けで異なる方針を設定することで、市場セグメントに応じた対応が明確になっている。
タイトル: GitHub Copilot インタラクションデータ利用ポリシーの更新
本日、GitHubが、よりインテリジェントで文脈を考慮したコーディング支援を提供するためにデータをどのように利用するかについて、ポリシーを更新することをお知らせします。4月24日以降、Copilot Free、Pro、Pro+ ユーザーのインタラクションデータ(具体的には入力内容、出力内容、コードスニペット、および関連するコンテキスト)は、オプトアウトしない限り、当社のAIモデルの学習と改善に利用されます。Copilot Business および Copilot Enterprise ユーザーは、この更新の対象外です。
参加をご希望でない場合は、「プライバシー」設定からオプトアウトできます。以前に製品改善のためのこのデータ収集をオプトアウトしている場合、その設定は引き継がれています。お客様の選択は保持され、オプトインしない限り、お客様のデータは学習に利用されることはありません。
この取り組みは確立された業界慣行に沿ったものであり、すべてのユーザーのモデル性能向上につながります。ご参加いただくことで、当社のモデルが開発ワークフローをより深く理解し、より正確で安全なコードパターンの提案を提供できるようになり、本番環境にリリースされる前に潜在的なバグを発見する支援能力が向上します。
実世界のデータ = より賢いモデル
当社の初期モデルは、公開データと手作業で作成されたコードサンプルを組み合わせて構築されました。この1年間、マイクロソフト社員のインタラクションデータの取り込みを開始し、複数言語における提案採用率の向上など、有意義な改善を確認しています。
マイクロソフトのインタラクションデータによる改善は、実世界のインタラクションデータで学習することで、より多様なユースケースに対応するモデル性能を高められることを示しています。本プログラムにご参加いただく場合、収集・活用される可能性のあるインタラクションデータには以下が含まれます:
- お客様が承認または修正した出力
- GitHub Copilot へ送信された入力(モデルに表示されたコードスニペットを含む)
- カーソル位置周辺のコードコンテキスト
- お客様が記述したコメントおよびドキュメント
- ファイル名、リポジトリ構造、ナビゲーションパターン
- Copilot機能とのインタラクション(チャット、インライン提案など)
- 提案に対するフィードバック(サムズアップ/ダウンの評価)
本プログラムでは、以下は利用しません:
- Copilot Business、Copilot Enterprise、または企業所有のリポジトリからのインタラクションデータ
- Copilot設定でモデル学習をオプトアウトしたユーザーのインタラクションデータ
- お客様のイシュー、ディスカッション、または保存状態のプライベートリポジトリのコンテンツ。「保存状態」という表現は意図的なものです。Copilotは、お客様がCopilotを能動的に使用している際にはプライベートリポジトリのコードを処理します。このインタラクションデータはサービス実行に必要であり、オプトアウトしない限りモデル学習に利用される可能性があります。
本プログラムで利用されるデータは、マイクロソフトを含む当社の企業グループ内の関連会社と共有される場合があります。このデータは、第三者のAIモデルプロバイダーやその他の独立したサービスプロバイダーとは共有されません。
AI支援開発の未来は、皆様のような開発者からの実世界のインタラクションデータにかかっていると当社は確信しています。そのため、マイクロソフトのインタラクションデータをモデル学習に利用しているほか、GitHub社員のインタラクションデータの利用も開始します。
お客様のインタラクションデータで当社のモデル改善にご協力いただける場合は、ありがとうございます。開発者コミュニティ全体に役立つAIツール構築において、お客様の貢献は大きな意味を持ちます。参加をご希望でない場合も問題ありません。お気に入りのAI機能をこれまで通り十分にご利用いただけます。
共に、お客様のワークフローを加速し、これまで以上に迅速により優れた安全なソフトウェアを構築する力を与えるAIを作り上げていきましょう。
ご質問がある場合は、FAQおよび関連するディスカッションをご覧ください。
この投稿「Updates to GitHub Copilot interaction data usage policy」は、The GitHub Blog に最初に掲載されました。
原文を表示
Today, we’re announcing an update on how GitHub will use data to deliver more intelligent, context-aware coding assistance. From April 24 onward, interaction data—specifically inputs, outputs, code snippets, and associated context—from Copilot Free, Pro, and Pro+ users will be used to train and improve our AI models unless they opt out. Copilot Business and Copilot Enterprise users are not affected by this update.
Not interested? Opt out in settings under “Privacy.” If you previously opted out of the setting allowing GitHub to collect this data for product improvements, your preference has been retained—your choice is preserved, and your data will not be used for training unless you opt in.
This approach aligns with established industry practices and will improve model performance for all users. By participating, you’ll help our models better understand development workflows, deliver more accurate and secure code pattern suggestions, and improve their ability to help you catch potential bugs before they reach production.
Real-world data = smarter models
Our initial models were built using a mix of publicly available data and hand-crafted code samples. This past year, we’ve started incorporating interaction data from Microsoft employees and have seen meaningful improvements, including increased acceptance rates in multiple languages.
The improvements we’ve seen by incorporating Microsoft interaction data indicate we can improve model performance for a more diverse range of use cases by training on real-world interaction data. Should you decide to participate in this program, the interaction data we may collect and leverage includes:
Outputs accepted or modified by you
Inputs sent to GitHub Copilot, including code snippets shown to the model
Code context surrounding your cursor position
Comments and documentation you write
File names, repository structure, and navigation patterns
Interactions with Copilot features (chat, inline suggestions, etc.)
Your feedback on suggestions (thumbs up/down ratings)
This program does not use:
Interaction data from Copilot Business, Copilot Enterprise, or enterprise-owned repositories
Interaction data from users who opt out of model training in their Copilot settings
Content from your issues, discussions, or private repositories at rest. We use the phrase “at rest” deliberately because Copilot does process code from private repositories when you are actively using Copilot. This interaction data is required to run the service and could be used for model training unless you opt out.
The data used in this program may be shared with GitHub affiliates, which are companies in our corporate family including Microsoft. This data will not be shared with third-party AI model providers or other independent service providers.
We believe the future of AI-assisted development depends on real-world interaction data from developers like you. It’s why we’re using Microsoft interaction data for model training and will begin using interaction data from GitHub employees as well.
If you choose to help us improve our models with your interaction data, thank you. Your contributions make a meaningful difference in building AI tools that serve the entire developer community. If you prefer not to participate, that’s fine too—you will still be able to take full advantage of the AI features you know and love.
Together, we can continue to build AI that accelerates your workflows and empowers you to build better, more secure software faster than ever.
If you have questions, visit our FAQ and related discussion.
The post Updates to GitHub Copilot interaction data usage policy appeared first on The GitHub Blog.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み