AI ネイティブなエンジニアリング組織を運営する
Anthropic の Claude Code チームは、コード生成の高速化に伴い従来のウォーターフォールやアジャイル計画が陳腐化したため、検証・レビュー・セキュリティを重視した「Just-in-Time」な工程と、AI を活用した文脈収集への転換という組織運営の根本的な再構築を行った。
キーポイント
JIT(ジャストインタイム)計画への移行
コード作成コストが低下したため、事前の詳細な設計ドキュメントや長期ロードマップから、プロトタイプ作成と即時フィードバックに基づく柔軟なスプリント計画へ変更された。
ボトルネックのシフト:検証とセキュリティ
コーディング自体は AI が高速化したが、コードの正しさの検証、レビュー、セキュリティ対策が新たなボトルネックとなり、人間の役割がここへ集中している。
文脈収集プロセスの再定義
「誰が書いたか」を問う従来の手法から、「何を知りたいか(回帰の原因か、顧客対応か意思決定の背景か)」を AI に問い、AI が直接回答できるかを判断する新しい基準へ移行した。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI がコード作成を自動化した後の組織運営におけるパラダイムシフトを明確に示しており、単なるツールの導入ではなく、工程そのものの再設計が必要であることを説いています。特に「検証とセキュリティ」が新たなボトルネックとなる点は、AI エンジニアリング組織を構築するすべてのリーダーにとって極めて重要な示唆であり、従来のアジャイルプラクティスを見直す契機となります。
編集コメント
コード生成の自動化が完了した後の「次の課題」である検証とレビューの重要性を、現場の実践例を通じて具体的に示しており、AI 導入後の組織変革を考える上で非常に示唆に富んでいます。
長年にわたり、エンジニアリングのキャパシティはアプリケーション構築における高コストな要素でした。ソフトウェアの計画やリリースに関わるかつてのプロセス、まずウォーターフォールモデル、その後アジャイルへと移行しましたが、すべてがこのコストを前提に設計されていました。
私は2000年代初頭にVisual Studioでの開発に従事し、キャリアをスタートさせました。その頃はCD-ROMでソフトウェアを配布しており、厳格な製造納期が存在しました。オンラインでのソフトウェア配布が可能になると、継続的なアップデートのリリースへと移行し始めました。現在では再び働き方を変えようとしており、今回はソフトウェアを書くのに要する時間と人件費が焦点となっています。
Claude Code チームにおいては、コードの記述、テスト作成、リファクタリングはもはや私たちの足かせとはなりません。しかし、エージェント型コーディングによって実際にコードをタイプする必要性が失われたとしても、ボトルネックが消えたわけではありません。代わりに検証(verification)、コードレビュー、セキュリティが新たな課題として浮上しました。
現在では誰もが非常に高速に大量のコードを生成できるようになりましたが、これに伴い新たな疑問も生じています。「このコードは正しいのか?」「どのように維持管理されるのか?」そして、同僚であるエンジニアリングリーダーから最も頻繁に寄せられる質問の一つは、「人間がどのようにして、你们的なコードレビューのペースについていけるのか?」です。
The processes that quietly stopped working
私たちはすべて、何かの隙間を埋めたり、より良く機能させたりする目的でプロセスを導入しています。しかし、その隙間がもはや存在しなくなり、それらのプロセスが時代遅れになった場合、それらは自ら消えることはほとんどありません。Claude Code チームがアジェンティックコーディングをデフォルトの作業方法として使い始めたとき、既存のプロセスの多くが機能しなくなりました。以下に、私たちが書き直した規範とその理由を示します。
Planning: shift roadmaps to just in time
従来の規範では、コーディングコストが高かったため、事前計画に多くの時間を費やすことが一般的でした。私が Claude Code チームに参加した当初、私たちは非常に良い 6 ヶ月間のロードマップを作成しましたが、Claude Code の登場により状況が次々と変化し、3 ヶ月目にはすでに時代遅れになっていました。
エンジニアリングの速度とスループットは現在では異なっているため、スプリントの計画方法も変わりました。私はこれを「ジャストインタイム(JIT)プランニング」と呼んでいます。まさに JIT コンパイルのように、「適切なタイミングで必要な分だけ」をどう行うかが問われます。私たちの計画のリテラルは、設計ドキュメントから PR やプロトタイプ内での議論へとシフトしました。この領域の動きが速いため、多くの製品レビューを行うことはなくなりました。現在のプロセスは、まずプロトタイプを作成し、多くの内部ユーザーに利用してもらい、そのフィードバックに基づいて行動を開始するというものです。
コンテキスト収集:著者に聞くのではなく、Claude に尋ねる
エンジニアがコードを記述していた時代、多くの質問に対する答えを得るための最初のステップは、そのコードを書いた人物を見つけることでした。現在ではすべてのプルリクエスト(PR)が Claude によって支援されているため、「誰がこの変更を加えたのか?」という問いだけでは不十分です。私たちの新しい規範は、一歩深く踏み込むことです:実際には何を知りたいのか?例えば、回帰の原因となった人物を探しているのか、顧客の質問に答える専門家が必要なのか、それとも意思決定の背景情報を求めているのか。そのような質問を Claude に投げかけ、より多くのデータと文脈を提供することで、Claude が直接回答できるかどうかを検討します。
Claude Code チームでは、どのような問いであっても、プロセスとして「これを自動化する方法はないか?」と必ず追加で問います。例えば、毎朝顧客フィードバックチャネルの要約を Claude に実行させることは、かつて私がコーヒーを飲みながら手動で行っていた儀式から、背景で自動的に実行されるタスクへと変化しました。
コードレビュー:信頼せよ、しかし検証せよ
私たちは Code Review を積極的に活用しています。Claude はスタイルやリンティングの処理、PR へのフィードバック要求、バグの検出と完全なコミット前の修正、テストの追加をすべて担当します。人間が必ず関与すべき領域は専門知識です。
新しい規範は、重要な場面で人間のレビューを行うことです:法的レビューにおいては、リスク許容度について常に法務パートナーに関与してもらいます。信頼境界やセキュリティに敏感なコードについては、ドメインの専門家に関与してもらいます。プロダクトマネージャーとデザイナーも、プロダクトセンスや審美性の観点から関与する必要があります。
ただし、モデルの改善に伴い信頼と検証の適切なバランスは常に変化していくため、継続的に評価を行うことが重要です。今日人間に必要とされるものが、次のモデルでは異なるものに見えるようになるかもしれません。
チーム構成:役割の境界が曖昧になる
Claude や AI はチーム全体の役割を再構築しました。現在、私たちのプロダクトマネージャー(PM)は多くのコードを書きますが、それは見ていて楽しいことです。Claude によって、非伝統的なバックグラウンドを持つ人々がより多くのエンジニアリング業務を担えるようになり、一方でエンジニアたちはコンテンツやデザインといった、従来技術側には含まれていなかった仕事も引き受けるようになりました。
Claude Code エンジニアリングチームにおいては、私は主に2つのプロファイルに重点を置いています。1 つ目は、製品感覚を持つ創造的なビルダーです。問題解決型の製品をリリースすることに深く好奇心を持ち、情熱を持っている夢想家たちです。もう 1 つは、深いシステム専門知識を持つエンジニアです。例えば、私がチームに参加した際、システム背景を持つ専門家不足に気づきました。Claude をウェブ上で動作させる Claude Code on the Web を構築する際には、どこでも Claude を実行できるようにするために、そのような専門知識が必要でした。
一方、私が重視しないのは純粋な処理速度です。その点はモデルが担ってくれます。より重要なのは、依然として人間の専門知識が必要な領域はどこかという問いであり、そこに焦点を当てるべきです。
Before
After
計画
6 ヶ月間の製品ロードマップ。
ジャストインタイム(JIT)計画:プロトタイプを作成し、内部ユーザーに使用してもらい、そのフィードバックに基づいて行動する。
文脈の収集
コードを書いた人物を見つけ、直接尋ねる。
まず Claude に質問する。その後、自分が尋ねていることが自動化可能かどうかを確認する。
コードレビュー
人間がすべてをレビューする。
Claude はスタイル、バグ、テストを担当する。ドメイン専門知識が重要な箇所は人間がレビューする。
チーム編成
固定された役割:エンジニアはコードを書き、PM(プロダクトマネージャー)は計画を立て、デザイナーはデザインを行う。
役割の境界が曖昧になる:PM がプロトタイプを作成し、エンジニアがデザインと文脈の把握を担当する。創造的なビルダーと深いシステム専門知識を持つ人材を採用する。
新しい規範の導入方法
これらの規範が変化するにつれ、一部の側面はチーム原則として義務化され、他の部分は小規模なサブチーム(ポッド)に任せて独自に見つけてもらうことにしました。Claude Code コアチームには、交渉不可能な「必須事項」としての一連の原則が存在します:
- 製品を徹底的に自社利用する:Claude Code チームの全メンバー、クロスファンクションなパートナーを含め、全員が Claude Code(および Claude Cowork)を利用しています。私たちは常に、Claude が私たちの業務をより速く、より効率的に行うための方法を模索し続けています。
- チームは可能な限りフラットに保つ:私が Claude Code に参加した際、すべてのマネージャーはまず IC(Individual Contributor:個人貢献者)としてスタートし、製品リリースを通じてチーム内で効果的なエンジニアとしての役割を学び、Anthropic のエンジニアとして働くことがどのようなものかを体感・理解することを望んでいました。Claude Code と Claude Cowork には一つの全体的なチームミッションがあります。マネージャーはチームの俊敏性を保ちつつ、作業のポッド(小グループ)をサポートし、人々が必要な場所に移動できるようにしています。
- 機能しなくなったプロセスを躊躇なく廃止する:最後に、私たちは「なぜそのように行うのか」について絶えず問い直します。何かがもはや意味をなさない場合、チームメンバーには古いプロセスに異議を唱え、廃止する明確な権限が与えられています。
これらの数少ないルールの中でさえ、各ポッドは大きな裁量権を持っています。Claude をどのようにトリアージ(選別)に活用するか、どのような計画会議やスタンドアップを実施するか、どのワークフローを最初に「Claudified」(Claude 化)するかについて、適応する余地があります。
新しいプロセスが定着したかどうかを知る方法
変更を導入する際に、すべてのエンジニアリングリーダーが今すぐ追跡し始めるべき数値を3つ紹介します。
- オンボーディングの習熟期間が短縮される:エンジニア、デザイナー、またはプロダクトマネージャー(PM)はいつから効果を発揮し始められるか?私たちのチームでは、1 年前よりもはるかに速く、エンジニアたちは最初の週にすでに本番コードをリリースするようになった。
- プルリクエスト(PR)のサイクル時間が短縮される:これはパイプラインがスケールする上でどこでつまずいているかを特定するのに役立つ可能性があるため、掘り下げてみると面白い。生成されるコード量が大幅に増えるにつれ、ビルドシステムや継続的インテグレーション(CI)が追いつかなくなる場合もある。
- クロード支援によるコミットが増加:私たちのチームではデフォルトで、すべてのコミットが Claude によって支援されている。過去 4 ヶ月間で、Claude 支援ではないコミットを見たことがない。
3 つ目の項目については、スループットと成功を混同しないこと。スループットは一つの指標に過ぎず、真の指標は解決しようとしている課題を測定することである。適切なアライメントがあれば、スループットは問題をより速く解決するのに役立つ。
始め方
もし私が一つだけお伝えできることがあるとすれば:最もノイズの多いワークフローを選べということだ。それは最もコストがかかるワークフローかもしれないし、あなたが恐れているもの、あるいはチームが楽しみにしていないものかもしれない。そして問うのだ:それでもなおその目的を果たしているか?そうであれば、それを自動化できないか?
かつて、高価な週次レビューを行うチームに所属したことがありました。会議室には大勢の人が集まり、全員がラップトップを操作していました。ただし、自分の番でステータス報告をする時だけ例外でした。彼らは顔を上げ、状況を報告するとすぐにまたラップトップに戻ります。私はただ一つのシンプルな質問をしました。「なぜ私たちは再びこの会議を開いているのでしょうか?これは私たちの時間の無駄遣いのように思えます。」そのたった一つの質問が、全員にこの会議が必要ないことを気づかせました。そこで私たちはその会議をキャンセルしました。
では、自問してみてください:あなたのエンジニアリングワークフローの中で、自動化を検討すべき、あるいは完全に廃止してもよい部分はどれでしょうか?
原文を表示
For years, engineering bandwidth was the expensive part of building applications. Every process we used to have around software planning and shipping, first waterfall and then agile, was built around that cost.
I started my career in the early 2000s working on Visual Studio. In those days we shipped software on CD-ROMs with hard manufacturing deadlines. Once we could distribute software online, we began increasing to shipping updates continuously. Now we’re changing the way we work again, this time around the time and people it takes to write software.
On the Claude Code team, writing code, writing tests, and refactoring rarely slows us down anymore. But the bottlenecks didn’t go away when agentic coding took away the actual need to type code. Verification, code review, and security took their place.
We can all generate a lot of code really fast now, but this also brings up new questions: Is this code correct? How is it maintained? And one of the top questions I get from fellow engineering leaders: “How are humans keeping up with how you’re doing code reviews?”* *
The processes that quietly stopped working
We all put processes in place for a reason, to close a gap or make something work better. But when that gap no longer exists and those processes become obsolete, they rarely go away on their own. When the Claude Code team began using agentic coding as our default way of working, a lot of our existing processes stopped working. Here are the norms we rewrote, and why.
Planning: shift roadmaps to just in time
The old norm was to spend a lot more time pre-planning because coding time was expensive. When I first joined the Claude Code team, we wrote a pretty good six month roadmap, and then *because* of Claude Code, so many things changed that it was out of date by month three.
Engineering speed and throughput is different now, so the way we plan sprints has changed. I call it just-in-time (JIT) planning, almost like JIT compiling: how do you do just the right amount at the right time? Our planning ritual shifted away from design docs toward discussions in PRs or prototypes. The space moves fast so we don’t do a lot of product reviews. Our process now is let's prototype, get a lot of internal users on it, and start acting on their feedback.
Context gathering: ask Claude, not the author
When engineers wrote code, the first step to getting an answer to most questions was to find the person who wrote the code. Now, since all our PRs are assisted by Claude, "Who made this change?" is no longer sufficient. Our new norm is to go a level deeper: what do you actually need to know? For instance: Are you looking for who caused a regression? An expert to answer a customer question? Or context on a decision? You ask Claude that question, and consider whether Claude can answer it directly, also with more data and context.
On the Claude Code team, no matter what that question is, our process is to also ask “Is there a way to automate it?” For example, having Claude summarize customer feedback channels every morning went from a ritual I did manually with my coffee to something I just have running automatically in the background.
Code review: trust but verify
We use Code Review heavily. Claude handles all the style and linting, PR feedback requests, catching bugs and fixing them before a full commit, and adding tests. Where we still definitely want a human is expertise.
The new norm is human review where it matters: for legal review, I always want my legal partner involved in risk tolerance. For trust boundaries and security-sensitive code, I want the domain experts. Product managers and designers also need to be involved with product sense and taste.
It’s important to continually evaluate, though, because the right balance of trust vs. verify will keep changing as the models improve. What you need humans for today might look different with the next model.
Team makeup: blurring roles
Claude and AI have reshaped roles across the team. Our PMs code a lot now, which is fun to see. With Claude, you have nontraditional coders now being able to do more engineering, and you have engineers who take on things like content and design, work that were traditionally not on the technical side.
On the Claude Code engineering team, I’ve indexed heavily on two profiles. One is creative builders with product sense: the dreamers who are deeply curious and passionate about shipping products that solve problems. The other one is engineers with deep systems expertise. For example, when I joined the team, I noticed we were missing experts with systems backgrounds and we needed that when building Claude Code on the Web, to ensure we can run Claude everywhere.
What I index on less, on the other hand, is raw throughput; the models handle that. The more important question is where you still need human expertise, and that’s where I’d focus.
How we rolled out our new norms
As these norms changed, some aspects were mandated as team principles and others we let small sub-teams (pods) figure out on their own. There is a set of the Claude Code core team principles that are non-negotiable “must dos”:
- Relentlessly dogfood your product: Every Claude Code team member, including cross-functional partners, uses Claude Code (and also Claude Cowork). We’re always thinking of ways to get Claude to help us do our work faster, and more efficiently.
- Keep the team flat as possible. When I joined Claude Code I wanted every manager to start out as an IC first, learn how to be an effective engineer on the team by shipping, and really live through and understand what it’s like to be an engineer at Anthropic. We have one overall team mission on Claude Code and Claude Cowork. Managers support pods of work while keeping the team agile so people can move to where the work is.
- Don’t hesitate to kill processes that no longer work: Finally, we relentlessly question why we do things the way we do. When something doesn’t make sense anymore, team members have explicit permission to question and kill old processes.
Within these few rules, though, each pod has a lot of agency. They have room to adapt how they use Claude to do triage, how they run any planning rituals or standups, and which workflows get “Claudified” first.
How to know your new processes are sticking
Here are three numbers every engineering leader should start tracking now as they roll out changes.
- Onboarding ramp time goes down: How soon can an engineer, a designer, or a PM start being effective? On our team this is much faster than a year ago, and engineers ship real code now within their first week.
- PR cycle time goes down: This one's interesting to dig into because it might help you identify where your pipeline is struggling to scale. As we’re generating so much more code, sometimes build systems and continuous integration (CI) may struggle to keep up.
- Claude-assisted commits going up: For us, by default, every commit is Claude-assisted. I don't think I've seen a non-Claude-assisted commit in the last four months.
On the third bullet, don't confuse throughput with success. Throughput is one metric, but the real metric is measuring the thing you're trying to solve. With the right alignment, throughput can help you solve problems faster.
Getting started
If I were to leave you with one thing: pick your noisiest workflow. That could be your most expensive workflow, the one you might be dreading, or that your team doesn't look forward to. And ask: is it still serving its purpose? If so, can you automate it?
I was once on a team that had an expensive weekly review, with a large number of people in a meeting room. I noticed everybody was on their laptops except when it was their time to give a status report. They would pop their head up, say the status, and go back down to their laptops. I asked one simple question: “Why are we having this meeting again? It seems like an expensive use of our time.” And just that one question made everyone realize it wasn’t needed. So we canceled it.
So, ask yourself: what's one piece of your engineering workflow that you might consider automating or even dropping altogether?
関連記事
Claude Code がアーティファクト機能をサポート
Anthropic は Claude Code に「アーティファクト」機能を追加し、PR の解説やシステム説明などの作業セッションをライブで共有可能な視覚ページに変換しました。この機能は自動更新やバージョン履歴をサポートし、チームと企業向けベータ版として提供されています。
Claude Code がアーティファクト機能をサポート
Anthropic は開発者向けツール「Claude Code」に、コード生成結果を直接表示・編集できる「アーティファクト」機能を追加した。これにより、開発ワークフローの効率化が図られる。
Claude Code の操作:CLAUDE.md ファイル、スキル、フック、ルール、サブエージェントなど
Anthropic は Claude Code の制御機能を強化し、設定ファイルや自動化機能の拡張を発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み