6000万件のCopilotコードレビューを達成
GitHub Copilot Code Reviewは利用数が10倍に成長し、全コードレビューの5分の1を占めるに至り、高精度なフィードバックと迅速なマージを実現するAgenticアーキテクチャへ進化している。
キーポイント
利用規模の急拡大と市場浸透
2024年4月の初回公開以来、利用数が10倍に成長し、GitHub上のコードレビューの20%以上をCopilotが担うに至った。
Agenticアーキテクチャへの移行とUX改善
リポジトリの文脈を取得し、変更点を推論するAgenticアーキテクチャへ移行。ユーザーのフィードバック(サマリーやリアクション)を反映し、UXを継続的に改善している。
「良いレビュー」の定義と評価指標
単なる網羅性から「高シグナルのフィードバック」へ重点を移し、正確性(Accuracy)、シグナル(Signal)、速度(Speed)の3要素を最適化している。
高精度なフィードバックと実用性の確保
71%のレビューで実行可能なフィードバックを提供し、残りの29%では沈黙を選択する「ノイズより沈黙」の方針により、レビューの質と速度を両立させている。
信号の質を速度より優先するトレードオフ
高度な推論モデルの採用によりレビュー速度は16%遅くなったが、ポジティブフィードバック率が6%向上し、信頼性の高い高信号の発見を重視する設計方針を示している。
エージェント型アーキテクチャによるレビュー精度の向上
コンテキストを知的に取得しリポジトリを探索する新設計により、初期のポジティブフィードバックが8.1%増加し、長文のプルリクエストや関連するIssue/PullRequestとの整合性チェックが可能になった。
ナビゲーションの改善とマルチラインコメントの導入
単一行への固定コメントから論理的なコード範囲に付随するマルチラインコメントへ移行し、フィードバックの理解と修正適用を容易にするノイズ削減施策を実施した。
影響分析・編集コメントを表示
影響分析
このニュースは、AI支援コードレビューが単なる実験的な機能から、開発ワークフローの標準インフラへと成熟したことを示している。特に「ノイズより沈黙」の方針とAgenticアーキテクチャの採用は、AIツールの実用性を高める上で重要な指針となり、他の開発ツールベンダーにも影響を与える可能性がある。
編集コメント
GitHubはCopilot Code Reviewの利用規模と技術的成熟度を明確に示しており、AIによるコード品質保証が開発プロセスの必須要素になりつつある現状を浮き彫りにしている。
タイトル: 6000万回のCopilotコードレビューを突破
昨年4月にCopilotコードレビュー(CCR)をローンチして以来、利用は10倍に成長し、現在GitHub上のコードレビューの5回に1回以上を占めています。
舞台裏では、コメントの品質向上に向けた継続的な実験を実施してきました。また、リポジトリのコンテキストを取得し変更内容を横断的に推論するエージェント型アーキテクチャに移行しました。各段階で、皆様からのフィードバックに耳を傾けてきました:アンケート回答や、コメントに対するシンプルな「いいね」「よくないね」の反応が、重要な課題の特定とUXの改善に役立ち、包括的なレビュー体験の提供につながっています。
Copilotコードレビューはプルリクエストのレビューと要約を処理し、チームがより複雑なタスクに集中できるようにします。
Suvarna Rane, Software Development Manager, General Motors
「良い」コードレビューの再定義
Copilotコードレビューが進化するにつれ、「良いコードレビュー」の定義も進化してきました。2024年に開発を開始した当初の目標は、徹底性を追求することでした。それ以来、開発者が実際に重視しているのは、プルリクエストを迅速に進めるのに役立つ高シグナルなフィードバックであることを学びました。現在、Copilotコードレビューは最高のモデル、メモリ、エージェント型ツール呼び出しを活用して包括的なレビューを実施します。ここに至るまで、エージェントの判断を調整するための継続的な評価ループを使用し、その体験を形作る3つの特性、すなわち正確性、シグナル、速度に焦点を当ててきました。
正確性
Copilotコードレビューが適切な判断を下し、重要なロジックと保守性の問題を優先することを目指してきました。パフォーマンスは2つの方法で評価しています:既知のコード問題に対する内部テストと、実際のプルリクエストからの本番シグナルを通じてです。本番環境では、2つの主要指標を追跡しています:
- 開発者フィードバック: コメントに対する「いいね」「よくないね」の反応は、提案が役立つかどうかを理解するのに役立ちます。
- 本番シグナル: フラグが立てられた問題がマージ前に解決されたかどうかを測定します。
これらのシグナルを組み合わせることで、Copilotコードレビューが重要な問題を表面化させ、迅速なマージが確信を持った修正から生まれ、レビュー精度の低下からではないことを保証するのに役立っています。

シグナル
コードレビューにおいて、コメントが多いことが必ずしも良いレビューを意味するわけではありません。私たちの目標はコメント量を最大化することではなく、実際に重要な問題を表面化させることです。
高シグナルなコメントは、開発者が問題と修正の両方を理解するのに役立ちます:

ノイズよりも沈黙の方が良い。レビューの71%で、Copilotコードレビューは実用的なフィードバックを提供します。残りの29%では、エージェントは何もコメントしません。
高シグナルな指摘を特定する能力が向上するにつれ、より自信を持ってコメントできるようになり、現在ではレビューあたり平均約5.1コメントを、レビューの煩雑さを増やしたり品質の閾値を下げたりすることなく達成しています。
速度
コードレビューでは速度は重要ですが、シグナルの方がより重要です。Copilotコードレビューは、プルリクエストが開かれた直後に信頼性の高い最初のレビューを提供するように設計されています。とはいえ、意味のあるレビューには依然として分析が必要です。推論能力が向上するにつれ、より深い問題を表面化させるために必要な計算量も増加します。
私たちはこれを意図的なトレードオフとして捉えています。最近の一つの変更では、より高度な推論モデルを採用することで、レビュー遅延が16%増加したにもかかわらず、肯定的なフィードバック率が6%向上しました。
私たちにとって、これは正しい交換です。実際の問題を表面化させるわずかに遅いレビューは、ノイズを増やすだけの即時フィードバックよりもはるかに価値があります。可能な限り遅延を削減し続けますが、開発者が信頼できる高シグナルな指摘を犠牲にすることは決してありません。
Copilotコードレビューを試す:コードベースを理解するAIコードレビューエージェント
Copilotコードレビューは、GitHub上で直接AIの提案を受けながら、バグを捕捉し、可読性を向上させ、プルリクエストのフィードバックを高速化するのに役立ちます。既存のプルリクエストワークフローに組み込まれるため、チームはより自信を持って迅速にリリースできます。
GitHubでCopilotコードレビューを始める >
エージェント型アーキテクチャについて
「良い」という新しい定義に基づき、コードレビューシステムを再開発しました。現在のエージェント型設計は、コンテキストをインテリジェントに取得し、リポジトリを探索してロジック、アーキテクチャ、特定の不変条件を理解できます。
この移行だけで、肯定的なフィードバックが当初8.1%増加しました。
その理由は以下の通りです:
- 読みながら問題を捕捉する(最後だけではない): 以前は、エージェントはレビューの最後まで結果を確定するのを待ち、しばしば初期の発見を「忘れる」ことにつながっていました。
- レビュー間でメモリを維持できる: 現在、すべてのプルリクエストが孤立したイベントである必要はありません。コードベースの一部でパターンにフラグを立てた場合、そのコンテキストを将来のレビューで再利用できます。
- 明示的な計画で長いプルリクエストをレビュー可能に保つ: レビュー戦略を事前に計画できるため、コンテキストが失われやすい長く複雑なプルリクエストでのパフォーマンスが大幅に向上します。
- リンクされたイシューとプルリクエストを読む: この追加コンテキストは、微妙なギャップにフラグを立てるのに役立ちます。これには、コードが単独では合理的に見えるがプロジェクトの要件に合わないケースも含まれます。
レビューをより簡単にナビゲートできるように
エージェントがプルリクエストとどのように相互作用するかを繰り返し改善することで、ノイズを減らしフィードバックをより実用的にしました。これがあなたにとって何を意味するか説明します。
- 複数行コメントでフィードバック(と修正)を素早く理解: 単一行にコメントを固定する方法から移行しました。論理的なコード範囲にフィードバックを添付することで、Copilotは何を参照しているのかをより簡単に確認し、提案された変更を適用できるようにします。

- プルリクエストのタイムラインを読みやすく保つ: 同じパターンエラーに対する複数の別々のコメント(煩雑になる可能性がある)の代わりに、エージェントはそれらを単一のまとまりのある単位にグループ化して認知負荷を軽減します。
- バッチ自動修正で問題のクラス全体を一度に修正: 提案された修正を一括で適用し、数十の個別の提案をコンテキストスイッチしながら行うのではなく、ロジックバグやスタイル問題のクラス全体を一度に解決します。
これを活用してください
AIがソフトウェア開発を加速し続ける中、チームが大規模にコードをレビューし信頼するのを支援することがこれまで以上に重要になっています。Copilotコードレビューは、プルリクエスト内で直接高シグナルなフィードバックを提供することでチームがペースを維持し、開発者が問題を早期に捕捉し、より自信を持ってマージできるようにします。
現在、12,000以上の組織がすべてのプルリクエストでCopilotコードレビューを自動的に実行しています。WEXでは、デフォルトのAI支援レビューへのこの移行により、エンジニアリング組織全体でのCopilot採用を拡大するのに役立っています:
「現在、開発者の3分の2がCopilotを使用しており、組織で最も活発なコントリビューターも含まれています。WEXはその後、すべてのリポジトリでCopilotコードレビューをデフォルトにすることで採用を拡大しました。開発者はまた、エージェントモードとコーディングエージェントを積極的に活用して自律性を高めており、WEXはデプロイメントの大幅な増加(約30%多くのコードがリリース)を実現しています。」 — WEXカスタマーストーリー
今後は、より深いパーソナライゼーションと高忠実度のインタラクティビティに焦点を当て、エージェントを改良してチームの暗黙の好みを学習させると同時に、マージ前に修正を調整し代替案を探索できる双方向の会話を可能にします。
コーディングと計画からレビューと自動化までCopilotの機能が進化し続ける中、目標はシンプルです:優れたソフトウェアが要求する信頼性と品質を維持しながら、開発者がより速く進めるのを支援することです。
今日から始めましょう
Copilotコードレビューは、Copilot Pro、Copilot Pro+、Copilot Business、およびCopilot Enterpriseで利用可能なプレミアム機能です。以下のリソースを参照してください:
- プランを選択
- CopilotライセンスなしでCopilotコードレビューを有効化
- デモビデオを視聴
すでにCopilotコードレビューを有効にしていますか?リポジトリまたは組織内のすべてのプルリクエストで自動Copilotコードレビューを設定するには、これらのドキュメントを参照してください。
考えやフィードバックがありますか?コミュニティディスカッションポストでお知らせください。
この投稿「6000万回のCopilotコードレビューを突破」は、The GitHub Blogに最初に掲載されました。
原文を表示
Since our initial launch of Copilot code review (CCR) last April, usage has grown 10X, now accounting for more than one in five code reviews on GitHub.
Behind the scenes, we’ve been running continuous experiments to enhance comment quality. We also moved to an agentic architecture that retrieves repository context and reasons across changes. At every step of the way, we’ve listened to your feedback: your survey answers and even your simple thumbs-up and thumbs-down reactions on comments have helped us identify key issues and iterate on our UX to provide a comprehensive review experience.
Copilot code review handles pull request reviews and summaries, allowing teams to focus on more complex tasks.
Suvarna Rane, Software Development Manager, General Motors
Redefining a “good” code review
As Copilot code review evolved over time, so has our definition of a “good code review.” When we started building it in 2024, our goal was simple thoroughness. Since then, we’ve learned that what developers actually value is high-signal feedback that helps them move a pull request forward quickly. Today, Copilot code review leverages the best models, memory, and agentic tool-calling to conduct comprehensive reviews. To get here, we’ve used a continuous evaluation loop to tune the agent’s judgment, focusing on three qualities that shape that experience: accuracy, signal, and speed.
Accuracy
Our aim has been for Copilot code review to deliver sound judgment, prioritizing consequential logic and maintainability issues. We evaluate performance in two ways: through internal testing against known code issues, and through production signals from real pull requests. In production, we track two key indicators:
Developer feedback: Thumbs-up and thumbs-down reactions on comments help us understand whether suggestions are helpful.
Production signals: We measure whether flagged issues are resolved before merging.
Together, these signals help ensure that Copilot code review surfaces issues that matter, and that faster merges come from confident fixes, not less scrutiny.

Signal
In code review, more comments don’t necessarily mean a better review. Our goal isn’t to maximize comment volume, but to surface issues that actually matter.
A high-signal comment helps a developer understand both the problem and the fix:

Silence is better than noise. In 71% of the reviews, Copilot code review surfaces actionable feedback. In the remaining 29%, the agent says nothing at all.
As our ability to identify high-signal findings improves, we’re also able to comment more confidently, now averaging about 5.1 comments per review without increasing review churn or lowering our quality threshold.
Speed
In code review, speed matters, but signal matters more. Copilot code review is designed to provide a reliable first pass shortly after a pull request is opened. That being said, meaningful reviews still require analysis. As reasoning capabilities improve, so does the computation required to surface deeper issues.
We treat this as a deliberate trade-off. In one recent change, adopting a more advanced reasoning model improved positive feedback rates by 6%, even though review latency increased by 16%.
For us, that’s the right exchange. A slightly slower review that surfaces real issues is far more valuable than instant feedback that adds noise. We continue to reduce latency wherever possible, but never at the expense of high-signal findings developers can trust.
Try Copilot code review: AI code review agent that understands your codebase
Copilot code review helps you catch bugs, improve readability, and speed up pull request feedback with AI suggestions right where you work on GitHub. It fits into your existing pull request workflow, so your team can ship faster with more confidence.
Get started with Copilot code review on GitHub >
About the agentic architecture
Given our new definition of “good,” we redeveloped our code review system. Today’s agentic design can retrieve context intelligently and explore the repository to understand logic, architecture, and specific invariants.
This shift alone has driven an initial 8.1% increase in positive feedback.
Here’s why:
It catches issues as it reads, not just at the end: Previously, agents waited until the end of a review to finalize results, which often led to “forgetting” early discoveries.
It can maintain memory across reviews: Now, every pull request doesn’t need to be an isolated event. If it flags a pattern in one part of the codebase, it can reuse that context in future reviews.
It keeps long pull requests reviewable with an explicit plan: It can map out its review strategy ahead of time, significantly improving its performance on long, complex pull requests, where context is easily lost.
It reads linked issues and pull requests: That extra context helps it flag subtle gaps. This includes cases where the code looks reasonable in isolation but doesn’t match the project’s requirements.
Making reviews easier to navigate
By iterating on how the agent interacts with pull requests, we’ve reduced noise and made feedback more actionable. Here’s what that means for you.
Quickly understand feedback (and the fix) with multi-line comments: We moved away from pinning comments to single lines. By attaching feedback to logical code ranges, Copilot makes it easier to see what it’s referring to and apply the suggested change.

Keep your pull request timeline readable: Instead of multiple separate comments for the same pattern error, which can be overwhelming, the agent clusters them into a single, cohesive unit to reduce cognitive load.
Fix whole classes of issues at once with batch autofixes: Apply suggested fixes in batches, resolving an entire class of logic bugs or style issues at once, rather than context-switching through a dozen individual suggestions.
Take this with you
As AI continues to accelerate software development, it’s more important than ever to help teams review and trust code at scale. Copilot code review helps teams keep pace by surfacing high-signal feedback directly in pull requests, enabling developers to catch issues earlier and merge with greater confidence.
More than 12,000 organizations now run Copilot code review automatically on every pull request. At WEX, this shift toward default AI –assisted reviews has helped scale Copilot adoption across the engineering organization:
Today, two-thirds of developers are using Copilot — including the organization’s most active contributors. WEX has since expanded adoption by making Copilot code review a default across every repository. Developers are also heavily utilizing agent mode and the coding agent to drive autonomy, helping WEX see a huge lift in deployments, with ~30% more code shipped. — WEX customer story
Going forward, we’re focused on deeper personalization and high-fidelity interactivity, refining the agent to learn your team’s unwritten preferences while enabling two-way conversations that let you refine fixes and explore alternatives before merging.
As Copilot capabilities continue to evolve, from coding and planning to review and automation, the goal is simple: help developers move faster while maintaining the trust and quality that great software demands.
Get started today
Copilot code review is a premium feature available with Copilot Pro, Copilot Pro+, Copilot Business, and Copilot Enterprise. See the following resources to:
Choose a plan
Enable Copilot code review without a Copilot license
Watch a demo video
Already enabled Copilot code review? See these docs to set up automatic Copilot code reviews on every pull request within your repository or organization.
Have thoughts or feedback? Please let us know in our community discussion post.
The post 60 million Copilot code reviews and counting appeared first on The GitHub Blog.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み