StripeのエンジニアがMinionsを導入、自律エージェントが週数千のプルリクエストを生成
Stripeのエンジニアは、LLM、ブループリント、CI/CDパイプラインを活用し、Slackやバグレポートなどからタスクを受け取り、週1300件以上のプルリクエストを生成する自律的なコーディングエージェント「Minions」を導入した。
キーポイント
自律コーディングエージェントの実用規模
Stripeが導入した「Minions」は自律的に動作し、週に1300件以上のプルリクエストを生成している。これは大規模な実運用環境でのAI活用事例を示している。
多様なタスクソースからの自動化
タスクはSlack、バグレポート、機能リクエストなど、日常的な開発プロセスの様々な箇所から自動的に発生・取得される。
信頼性確保のための技術的アプローチ
LLM、事前定義されたブループリント、CI/CDパイプラインを組み合わせることで、本番環境対応の変更を生成しつつ、信頼性を維持し、人間によるレビューを組み込んでいる。
開発プロセスへの統合と生産性向上
自律エージェントが日常的なコーディング作業を自動化することで、エンジニアの生産性向上と、より複雑な問題への集中が可能になる。
影響分析・編集コメントを表示
影響分析
この記事は、AIによるソフトウェア開発自動化が実験段階を超え、Stripeのような大規模な実運用環境で本格的に導入され、具体的な生産性向上(週1300件以上のPR)を実現していることを示す。これは、AIが開発者の補助ツールから、開発プロセスに統合された自律的なエージェントへと進化する重要なマイルストーンであり、業界全体の開発ワークフロー再定義の動きを加速させる可能性が高い。
編集コメント
「AIがコードを書く」という概念が、具体的な数値(週1300PR)と明確な運用プロセス(Slack起点、ブループリント、CI/CD統合)を伴って実現された点が画期的。実用フェーズへの移行を強く印象付けるニュース。
Stripe のエンジニアたちは、単一の指示からソフトウェア開発タスクをエンドツーエンドで完了できる自律型コーディングエージェント「Minions」を開発しました。このシステムは、大規模言語モデル(LLM)と内部のデベロッパーツールを統合し、最小限の人間的介入で本番環境対応のプルリクエストを生成します。Stripe のエンジニアによると、Minions は現在週に 1,300 件以上のプルリクエストを生成しており、以前の試行時の 1,000 件から増加しています。すべての変更は人間によってレビューされますが、人々が書いたコードは一切含まれていません。
Minions が管理するコードは、Stripe において年間 1 兆ドルを超える決済取引高を支えており、金融機関との複雑な依存関係や規制枠組み、コンプライアンス義務にまたがる環境で稼働しています。この規模で自律型エージェントを展開する上で、信頼性と正確性は依然として中核的な要素です。
Stripe のエンジニアリングマネージャーである Cameron Bernhardt は LinkedIn の投稿で次のように述べています:
Minions は概念段階から週に 1,000 件を超えるプルリクエストを生成するまでに進化しました。すべてのコードは人間によってレビューされますが、エージェントはエンドツーエンドの変更をますます多く生成しています。
Minions は、GitHub Copilot や Cursor のような対話型コーディングアシスタントや AI コードエディタとは異なり、一度きりのエンドツーエンドのタスクを実行します。タスクは、Slack スレッド、バグレポート、機能リクエストなど、複数のソースから発生する可能性があります。タスクの説明が Minion に送信されると、Minion はブループリント(決定論的コードと柔軟なエージェントループを組み合わせたもの)を使用して作業を調整し、必要なコード、テスト、ドキュメントを生成します。ワークフローは、人間のレビューのためにプルリクエストが提出されることで完了し、エンジニアは最小限の手動介入でタスク定義から本番環境対応のコードへと移行できます。
Minion を呼び出す Slack メッセージの例(出典:Stripe Blog Post)
このシステムは、Block によって開発された当初広く使用されたコーディングエージェントの一つである Goose の内部フォークから進化しました。Goose は Stripe の LLM インフラストラクチャ向けにカスタマイズされ、Minion の特定の要件を満たすように洗練されました。一方、Cursor や Claude Code などの対話型ツールは、人間の監督下でのワークフローを継続してサポートしています。
Minion はブループリントによって調整されます。ブループリントはコードで定義されたワークフローであり、タスクがどのようにサブタスクに分割され、タスクの種類に応じて決定論的ルーチンまたはエージェントのいずれによって処理されるかを指定します。Stripe のエンジニアたちは、ブループリントを効率性を確保しつつ適応性を維持するために、コードと織り交ぜられたエージェントスキルのコレクションとして説明しています。
Minion の例示的なブループリント(出典:Stripe Blog Post)
信頼性は、CI/CD パイプライン、自動テスト、静的解析を通じて強化され、生成された変更が人間のレビュー前にエンジニアリング基準を満たすことが保証されます。エンジニアたちは、Minion は設定調整、依存関係のアップグレード、小規模なリファクタリングなど、明確に定義されたタスクにおいて最も効果的に機能すると指摘しています。
このシステムは、LLM ベースのエージェントが開発環境、バージョン管理、CI/CD パイプラインと密接に統合され、最小限の監督で本番品質のコードを生成する、エージェント駆動型ソフトウェア開発におけるより広範なトレンドを反映しています。Stripe の経験から、自律的なコーディングエージェントは厳格な品質管理を維持しつつ、開発者の生産性を大幅に向上させることができることが示唆されています。
著者について
Leela Kumili
Leela はスターバックスのリードソフトウェアエンジニアであり、スケーラブルでクラウドネイティブなシステムや分散プラットフォームの構築における深い専門知識を持っています。彼女はリワードプラットフォーム全体にわたってアーキテクチャ、デリバリ、運用の卓越性を推進し、システムの近代化、スケーラビリティの向上、信頼性の強化に向けた取り組みを主導しています。
技術的なリーダーシップに加えて、リーラは組織の AI チャンピオンとしても活動しており、LLM ベースのツールを活用して開発者の生産性やワークフローを改善する機会を特定し、AI 導入のためのベストプラクティスを確立しています。彼女は本番環境で運用可能なシステムの構築、開発者体験の向上、そしてエンジニアが技術面と戦略面の両方で成長できるよう指導することに情熱を注いでいます。彼女の関心領域には、プラットフォームエンジニアリング、分散システム、開発者の生産性、そして技術的ソリューションとビジネス・製品目標をつなぐことが含まれています。
Show moreShow less
原文を表示
Engineers at Stripe have developed Minions, autonomous coding agents capable of completing software development tasks end-to-end from a single instruction. The system integrates large language models (LLMs) with internal developer tooling to generate production-ready pull requests with minimal human intervention. Stripe engineers reported that Minions now produce over 1,300 pull requests per week, up from 1,000 in earlier trials. All changes are human-reviewed but contain no human-written code.
The code managed by Minions supports more than $1 trillion in annual payment volume at Stripe and operates across complex dependencies with financial institutions, regulatory frameworks, and compliance obligations. Reliability and correctness remain central to deploying autonomous agents at this scale.
Cameron Bernhardt, engineering manager at Stripe, mentioned in a LinkedIn post:
Minions have progressed from concept to generating over a thousand pull requests per week, All code is human-reviewed, but the agents are increasingly producing changes end-to-end.
Minions differ from interactive coding assistants such as GitHub Copilot or AI code editors like Cursor by executing one-shot, end-to-end tasks. Tasks can originate from multiple sources, including Slack threads, bug reports, or feature requests. A task description is sent to a Minion, which orchestrates the work using blueprints, a combination of deterministic code and flexible agent loops to produce the required code, tests, and documentation. The workflow concludes with a pull request submitted for human review, allowing engineers to move from task definition to production-ready code with minimal manual intervention.
Sample Slack message invoking Minion (Source: Stripe Blog Post)
The system evolved from an internal fork of Goose, one of the first widely used coding agents developed by Block. Goose was customized for Stripe’s LLM infrastructure and refined to meet the specific requirements of Minions, while interactive tools such as Cursor and Claude Code continue to support human-supervised workflows.
Minions are orchestrated using blueprints, workflows defined in code that specify how tasks are divided into subtasks, handled either by deterministic routines or by the agent, depending on the task. Stripe engineers describe blueprints as a collection of agent skills interwoven with code to ensure efficiency while retaining adaptability.
Minion example blueprint (Source: Stripe Blog Post)
Reliability is reinforced through CI/CD pipelines, automated tests, and static analysis, ensuring generated changes meet engineering standards before human review. Engineers noted that Minions perform best on well-defined tasks such as configuration adjustments, dependency upgrades, and minor refactoring.
The system reflects a broader trend in agent-driven software development, where LLM-based agents are tightly integrated with development environments, version control, and CI/CD pipelines to produce production-quality code with minimal supervision. Stripe’s experience suggests that autonomous coding agents can significantly augment developer productivity while maintaining strict quality controls.
About the Author
Leela Kumili
Leela is a Lead Software Engineer at Starbucks with deep expertise in building scalable, cloud-native systems and distributed platforms. She drives architecture, delivery, and operational excellence across the Rewards Platform, leading efforts to modernize systems, improve scalability, and enhance reliability.
In addition to her technical leadership, Leela serves as an AI Champion for the organization, identifying opportunities to improve developer productivity and workflows using LLM-based tools and establishing best practices for AI adoption. She is passionate about building production-ready systems, enhancing developer experience, and mentoring engineers to grow in both technical and strategic impact. Her interests include platform engineering, distributed systems, developer productivity, and bridging technical solutions with business and product goals.
Show moreShow less
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み