エージェンティックAIパターンがエンジニアリング規律を強化
Paul Duvallは、AI支援開発のためのエンジニアリングパターンライブラリと高品質な成果物を確実にする実践について議論し、Paul StackとGergely Oroszによる関連議論は、リミックスと仕様駆動開発へのシフトを強調している。
キーポイント
AI支援開発のためのエンジニアリングパターン
Paul Duvallが、AIを活用した開発を支援するためのエンジニアリングパターンのライブラリを紹介し、高品質な成果物を確実にする実践について議論している。
リミックスと仕様駆動開発へのシフト
Paul StackとGergely Oroszによる関連議論が、開発プロセスにおけるリミックス(既存要素の組み合わせ直し)と仕様駆動開発への移行を強調している。
エージェンシックAIパターンによる規律強化
記事タイトルが示すように、エージェンシック(自律的・主体的)なAIパターンが、ソフトウェアエンジニアリングの規律を強化する方向性が議論されている。
影響分析・編集コメントを表示
影響分析
この記事は、AIを開発プロセスに統合するための体系的なアプローチの重要性を示しており、単なるツール利用から、エンジニアリング規律に基づいたAI活用への移行を促す可能性がある。特に、仕様駆動開発への注目は、AI時代のソフトウェア開発方法論の進化を示唆している。
編集コメント
AI開発ツールの実践的な活用方法に焦点を当てた内容で、現場のエンジニアにとって参考になる視点を提供している。ただし、具体的な技術詳細や実装例が限られているため、より深い分析には追加情報が必要。
最近の AI DevOps Podcast で、ポール・ダヴァルは、現代モデルの能力が高まるにつれて、エージェント型 AI パターンが中核的なエンジニアリング分野を強化している様子について議論しました。また、彼は AI 支援ソフトウェア開発のための実践を文書化し進化させる場所として、自身のエージェント型 AI エンジニアリングパターンのリポジトリも共有しました。
『継続的インテグレーション:ソフトウェアの品質向上とリスク低減』の著者であるダヴァルは、このパターン集を、クライアントワークにおけるエージェント型 AI の実践的な利用を通じて確立されたエンジニアリングプラクティスがどのように適応されているかを探索するものとして位置づけました。彼は「AI がコードを生成している場合でも、エンジニアリングプラクティスはさらに重要になっている」と述べ、AI によって生成された出力を共有パターンに基づかせることの重要性を強調しました。
AI によって生成されるコードの量に鑑み、ダヴァルは、変更速度が増大する中で品質を維持するために不可欠となるトランクベース開発(trunk-based development)、早期かつ頻繁なコミット、そして自動テストの継続的な重要性を強調しました。
また、ダヴァルは、AI 生成出力を取り扱う際に「もはやすべてのコード行をレビューしていない」と述べ、開発者がコードと対話する方法に変化が生じていることを指摘しました。変更量の増加により、すべての行を確認することが次第に現実的でなくなっているためです。その代わりに、ダヴァルは、エージェントが自身の出力をレビューし改善できるようなコード化されたスキルを含む、自動検証とエージェント型ガードレール(agentic guardrails)への依存を強調しました。
Duvall氏はまた、仕様駆動型開発などのアプローチが既存のエンジニアリングプラクティスをどのように進化させているかについても議論しました。Duvall氏のリポジトリには、AWS IAM ポリシー生成シナリオにおけるエージェント可読な仕様の例が含まれており、期待される動作、制約、受入基準を事前に定義することで、エージェントが明確な仕様に対して出力の生成と検証を行えるようにしています。AI支援ワークフローを導くために、よく知られたテストファーストパターンがどのように適応されているかについて説明する際、彼は次のように述べています。
私はまさに…アジャイルやXPで行ってきたことを複製しているのです…それは文字通り「赤、緑、リファクタリング」と言っています。私はそのプロセスを踏みます。
Duvall氏はまた、エージェントライフサイクルの初期段階における課題、特に意図の定義に関する課題にも注目しました。彼は、AIツールが素早くコードを生成できる一方で、曖昧または不十分な入力は一貫性のない予測不能な結果をもたらすことが多いと指摘しています。このことが、役割、文脈、制約を通じて意図を記述する構造化されたプロンプトや、定義された動作から導き出される仕様駆動型開発および受入テストなど、より明確な仕様に従ってエージェントを駆動することへの注目を高めています。「意図が何であるかを完全に記述しない場合」、ランダムな結果「しか得られない」と彼は注意しています。
同様に、明確な仕様への焦点は最近、DevSecOps Talks ポッドキャストで議論されました。出演したのは System Initiative の製品ディレクターであるポール・スタック氏です。彼は SWAMP という、インフラの自動化と検証のためのエージェント型オープンソースプラットフォームの開発に携わっています。スタック氏は、開発プロセスをエージェントを中心に再構築している様子について語りました。その徹底振りから、プルリクエスト(Pull Request)の受け入れを拒否し、仕様駆動型開発へと繋がる GitHub Issue ベースのワークフローを優先するに至った点まで言及しています。彼は次のように述べています。
「私たちはプルリクエストを受け付けていません…もし設計があるなら、Issue を開いてください。そうすれば対話的にそのプロセスを進め、一緒に設計しましょう」
スコット・ハンセルマン氏のポッドキャストに登場した『The Pragmatic Engineer』ニュースレターの著者であるゲルゲー・オロシュ氏は、「リミックス」という手法を好むオープンソースプロジェクトについて議論しました。これはプルリクエストのマージを避け、貢献された PR をプロジェクトの基準に沿ってエージェントが再構築するアプローチです。これと対比して、ハンスelman 氏は、要件を満たすまでサブエージェントが反復的に解決策を洗練させる完全自動化された「ラルフ・ループ」を用いる自律型エージェントについても言及しました。その上で、重要なシステムにおいてはアーキテクチャやデザインの「センス(品味)」が重要であることは認めつつも、「無限に忍耐強い新人エンジニア」というマインドセットは、単調な作業には非常に適している可能性があると指摘しています。
Stack はまた、エージェントが「コードベースと整合性のある方法でコードを生成」できるようにするため、正確なアーキテクチャパターンとプラクティスを提供することの重要性を強調しました。これには、事前にアーキテクチャ、制約、テストの期待値を定義することが含まれます。InfoQ のボリス・チェルニー(Boris Cherny)のアジェンティック・ワークフローに関する報道と同様に、Stack は実行前に意図を確認するために Claude の「プランモード」も使用しており、これにより「AI による恐怖物語」を防ぐのに役立っています。
Duvall もまた、フィードバックループを本番環境へシフトし拡張することの重要性を指摘しました。彼は、観測性(observability)、テレメトリ、さらには本番環境内のテストを活用してフィードバックサイクルを短縮し、開発ライフサイクルにライブ信号を解釈して戻す方法を説明しました。将来を見据え、AI はより小さく焦点を絞ったチームをもたらす可能性があると示唆し、調整オーバーヘッドの減少と自動化の増加に伴い、「ピザ 1 枚分のチーム(one pizza team)」への移行が進むと述べました。
Duvall は、エンジニアリングにおける以前のシフトと同様に、品質はもはや人間の検査ではなく自動化を通じて達成されるようになっていると示唆しました。彼は次のように述べています:
「コードレビューを行う仕組みを導入しますが、毎回必ずしもあなた自身が直接レビューするわけではありません。」
Duvall と Stack の両氏は、AI を活用した開発には、左側シフト(shift-left)のプラクティスと右側シフト(shift-right)フィードバックの組み合わせが必要であり、行動定義やプロダクション状態が検証プロセスの一部となる点を強調しました。また Duvall は、AI が生産テレメトリをより広範に分析することでパターンを特定し、問題を早期に浮き彫りにする利点にも言及しています。
Duvall のリポジトリは継続的に更新されており、開発・セキュリティ・運用の各シナリオにおける成熟度レベルを持つ構造化されたパターンを定義しています。これらのパターンには、仕様駆動型開発(specification-driven development)、コード化されたルールとアーキテクチャ制約、並列エージェントによる原子分解(atomic decomposition)、および自動追跡可能性を備えたワークフローのための観測可能な開発(observable development)が含まれます。
コード中心の開発からさらにシフトする点を認識し、Orosz はエンジニアリングのアイデンティティと実践がコードそのものを超えて一段階上位へと移行すると振り返りました。彼は次のように述べています。
コーディングよりもはるかに重要な何かこそが私たちを特別なものにしていると考え、それを育むべきだと私は思います。
著者について
ラフィク・ジェムイル
ラフィク・ジェムイルは、ニュージーランドを拠点とするエンジニアリングリーダーであり、グローバルに分散したチームや高ボリュームの SaaS プラットフォームのスケーリングに注力する実践者です。彼の活動の中心は、強力なエンジニアリングプラクティス、プラットフォーム思考、そして AI 支援開発の実用的な導入を通じて、エンジニアリングの有効性を高めることにあります。
もっと見る 表示しない
原文を表示
On a recent AI DevOps Podcast, Paul Duvall discussed how agentic AI patterns are reinforcing core engineering disciplines as the capability of modern models increases. He also shared his repository of agentic AI engineering patterns, where he is documenting and evolving practices for AI-assisted software development.
Duvall, author of Continuous Integration: Improving Software Quality and Reducing Risk, positioned his collection of patterns as an exploration of how established engineering practices are being adapted through hands-on use of agentic AI in client work. He emphasised grounding AI -generated output in shared patterns, stating that "engineering practices are becoming even more relevant when you have AI generating code."
Given the volume of code generated by AI, Duvall emphasised the continued importance of trunk-based development, committing early and often, and automated testing, explaining that these become essential for maintaining quality as the rate of change increases.
Duvall also described a shift in how developers interact with code, observing that he is "not reviewing every line of code now" when working with AI-generated output, as the volume of change makes this increasingly impractical. Instead, Duvall emphasised relying on automated validation and agentic guardrails, including codified skills that allow agents to review and refine their own output.
Duvall also discussed how approaches such as specification-driven development are evolving existing engineering practice. Duvall's repository includes examples of agent-readable specifications for an AWS IAM policy generation scenario, defining expected behaviour, constraints, and acceptance criteria up front, enabling agents to generate and validate output against a clear specification. Describing how familiar test first patterns are being adapted to guide AI-assisted workflows, he said:
I'm literally... replicating what we did with Agile and XP... it literally says red, green, refactor... I go through that process.
Duvall also highlighted challenges earlier in the agentic lifecycle, particularly around defining intent. He noted that while AI tools can generate code quickly, vague or underspecified inputs often lead to inconsistent or unpredictable results. This has led to increased focus on driving agents with clearer specifications, including structured prompts that describe intent through role, context, and constraints, alongside specification-driven development and acceptance tests derived from defined behaviour, noting that "if you don't fully describe what the intent is," you will "have random results."
A similar focus on clearer specifications was recently discussed on the DevSecOps Talks podcast with Paul Stack, System Initiative's director of product, who works on SWAMP, an agentic open source platform for automating and validating infrastructure. Stack described how he was restructuring development processes around agents, even to the point of refusing pull requests in favour of GitHub Issue-based workflows that feed into specification-driven development. He said:
We do not accept pull requests... if you have a design... open an issue and we'll interactively walk through this and we'll design it together.
Appearing on Scott Hanselman's podcast, Gergely Orosz, author of The Pragmatic Engineer newsletter, discussed an open source project that refrains from merging pull requests in favour of "remixing", where contributed PRs are rebuilt by agents in line with project standards. Contrasting this with autonomous agents using fully automated "Ralph loops," where subagents iteratively refine solutions until requirements are met, Hanselman acknowledged that although architectural and design "taste" is important in critical systems, the mentality of an "infinitely patient junior engineer" can be well suited to toil.
Stack also emphasised the importance of providing accurate architectural patterns and practices so that agents can "produce the code in a way that was coherent with your codebase," alongside defining architecture, constraints, and testing expectations up front. Like InfoQ's reporting of Boris Cherny's agentic workflow, Stack said that he also uses Claude's "plan mode" to review intent before execution, helping avoid "AI horror stories."
Duvall also pointed to the importance of shifting right and extending these feedback loops into production. He described how observability, telemetry, and even tests in production can be used to shorten feedback cycles, interpreting and sending live signals back into the development lifecycle. Looking ahead, he suggested that AI may result in smaller, more focused teams, describing a move towards a "one pizza team" as coordination overhead reduces and automation increases.
Duvall suggested that, as with earlier shifts in engineering, quality is increasingly achieved through automation rather than human inspection. He said:
You're putting in mechanisms... such that the code is reviewed... but it might not be reviewed literally by you every single time.
Duvall and Stack both highlighted that AI-assisted development requires a mix of shift-left practices and shift-right feedback, where behavioural definitions and production state become part of the validation process. Duvall also noted the advantages of AI analysing production telemetry more expansively to identify patterns and surface issues earlier.
Duvall's repository is continuously updated and defines structured patterns with maturity levels across development, security, and operational scenarios. The patterns include specification-driven development, codified rules and architectural constraints, atomic decomposition with parallel agents, and observable development for workflows with automated traceability.
Acknowledging the shift beyond code-centric development, Orosz reflected that engineering identity and practice will move up a level, beyond the code itself. He said:
I think there is something much more than coding that makes us special and I think we should cultivate that.
About the Author
Rafiq Gemmail
Raf Gemmail is a New Zealand based engineering leader and practitioner focused on scaling globally distributed teams and high-volume SaaS platforms. His work centres on improving engineering effectiveness through strong engineering practices, platform thinking, and pragmatic adoption of AI-assisted development.
Show moreShow less
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み