AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
LangChain Blog·2026年4月22日 01:50·約21分で読める

アジェンティック・エンジニアリング:AIエージェントの群れがソフトウェアエンジニアリングを再定義する方法

#Multi-Agent Systems#Agentic AI#Software Engineering Automation#Cisco#LangChain
TL;DR

Ciscoのエンジニアリングチームは、単なるコード生成を超え、役割分担と共有メモリを持つ複数のAIエージェントを協調させる「Agentic Engineering」のパイロット実証により、デバッグの根本原因特定時間を93%短縮し、開発ワークフローの効率を大幅に向上させた。

AI深層分析2026年4月26日 17:06
4
重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
4
革新性10%
3

キーポイント

1

Agentic Engineeringの定義と構造

単一のAIエージェントではなく、役割分担、共有メモリ、可観測性レイヤーを持つ複数のエージェントを協調させるモデルであり、コード生成だけでなくソフトウェア納品パイプライン全体を運用する。

2

実証された具体的な成果

20以上のデバッグワークフローにおけるパイロット試験で、根本原因特定までの時間が歴史的ベースライン比で93%短縮され、512セッションで200時間以上のエンジニアリング時間を節約した。

3

従来のAIコーディングエージェントとの違い

CodexやClaudeのような単一セッションのコード生成ツールとは異なり、クロスチームのワークフローを調整し、長期的なメモリと状態管理を行う制御平面として機能する。

4

技術的統合と将来展望

従来のコーディングエージェントは、Agentic Engineeringのワーカーエージェント内部で推論およびコード生成エンジンとして組み込まれることで、相互補完的な関係にある。

影響分析・編集コメントを表示

影響分析

この記事は、LLMを単なるツールとして使用する段階を超え、自律的なエージェントを組織内の「デジタルチーム」として統合する新しいソフトウェア開発パラダイムを示唆しています。実証された数値(93%の時間短縮)は、このアプローチが理論的な可能性を超えて実務レベルで高いROIをもたらすことを示しており、大規模なエンタープライズ環境におけるAI統合の標準となる可能性を秘めています。

編集コメント

単一エージェントの限界を超え、複数エージェントの協調と状態管理に焦点を当てた実証事例は、エンタープライズAI導入における次の重要なマイルストーンとなります。特に「コード生成」ではなく「ワークフローの最適化」に価値を見出している点が、実務導入における重要な示唆を含んでいます。

imageimage.png)

主要なポイント

  • エージェント型エンジニアリングとは何か?エージェント型エンジニアリングは、AIエージェントが定義された役割、共有メモリ、共通の観測可能性レイヤーを持つデジタルチームメンバーとして行動し、コード生成を高速化するだけでなく、ソフトウェアの完全なデリバリーパイプラインを通じてソフトウェアを進めるためのマルチエージェント調整モデルです。
  • ソフトウェアデリバリーにおいてマルチエージェントシステムはどのような結果を生み出せるか?20以上のデバッグワークフローでのパイロットテストでは、協調されたエージェントの実行により、歴史的なベースラインと比較して根本原因特定までの時間が93%短縮され、単一月の512セッション全体で200時間以上のエンジニアリング時間を節約しました。開発ワークフローでは実行時間が65%短縮され、最大の改善効果はコード生成ではなく、下流のテスト圧縮から得られました。
  • エージェント型エンジニアリングはCodexやClaudeのようなAIコーディングエージェントとどう異なるか?AIコーディングエージェントは、単一のユーザー主導セッション内で意図をコードに変換することに優れています。一方、エージェント型エンジニアリングはより高い抽象度のレベルで動作します:これはチーム横断的なワークフローを調整し、エージェント間で長期メモリを維持し、ソフトウェアデリバリーライフサイクル全体にわたって状態と追跡可能性を管理するコントロールプレーンです。これらは競合関係にあるのではなく、Codexのようなコーディングエージェントは、推論およびコード生成エンジンとしてワーカーエージェント内部で実行することができます。

これは、シスコのプリンシパルソフトウェアエンジニア(ディレクター)であるRenuka Kumar氏と、シスコのシニアエンジニアリングディレクターであるPrashanth Ramagopal氏による寄稿記事です。このブログで表明されている意見は著者の見解であり、シスコの見解ではありません。

ソフトウェア開発は新たなフェーズに入りました。ここではインテリジェントエージェントが孤立したツールではなく、現実のチームを模倣する協調されたエンティティとして機能します。AIの採用が加速するにつれて、焦点は「何が可能か」から「実際に何が無効か」へとシフトしました。要件定義、設計、開発、セキュリティ、テスト、デプロイメント、運用というソフトウェアエンジニアリングのすべての段階は、少なくとも部分的な自動化の対象となり得ますし、エージェントが機能的に連携すれば完全なエンドツーエンドのオーケストレーションをサポートすることさえあります。この目標は、「いかにしてコードをより速く書くか」から「いかにしてソフトウェアをシステム内をより安全かつ迅速に流すか」へと変化します。複数のアジェンティックフレームワークの実験を通じて、私たちは実際に測定可能なインパクトをもたらす実用的なパターンを特定しました。

このブログでは、タスクレベルの実行からシステムレベルの協調へと移行するために設計されたエージェント型エンジニアリング・システムについて説明します。私たちは、LangChainのツールスイート(LangSmithおよびLangGraphを含む)を使用して実装されたマルチエージェント協調フレームワークの参照アーキテクチャとパイロット評価を提案します。このシステムが何ではないかと言えば、「より優れたコーディングAI」でも「より優れたタスクアシスタント」でもありません。このアーキテクチャは、エンドツーエンドのソフトウェア納品に焦点を当てた、マルチエージェント協調のためのコントロールプレーンとして機能するように設計されています。

エージェント型エンジニアリングは現実のエンジニアリングを模倣する

私たちの核心的な洞察はシンプルです。

*「最大のステップチェンジは、単により良いツールから来るものではありません。それは現実のチームを模倣するシステムから来るものです。」*

エージェント型エンジニアリングの中核には、エンジニアリングチームがソフトウェアを計画し、実行し、納品する方法を模倣するように設計された、インテリジェントなエージェントの協調システムがあります。AIを孤立したアシスタントの集合体として扱うのではなく、このフレームワークはエージェントをチームメンバーとしてモデル化します。各エージェントには明確な責任、共有されたコンテキスト、そして説明責任が定義されており、軽量ながら強力なリーダーシップレイヤーを通じて調整されます。

このシステムは、マルチエージェント協調のためのネイティブなコントロールプレーンを提供し、以下の能力を備えています:

  • 長期にわたるワークフローを実行する
  • チーム間で共有可能なエージェントのメモリを保持する
  • チームの境界をまたいで移動できる、異なる種類のワークフローを連鎖させる
  • エージェント型ワークフローへの新規チームメンバーのオンボーディングを支援するために、知識共有を促進する
  • 追跡可能性と監査性を確保するため、エージェント的に実行されたワークフローに対するグローバルな可観測性を実現する

アーキテクチャ

高レベルでは、このシステムは独立したエンティティとして、あるいはエージェントの群れ(swarm)内の一部として動作することのできる、疎結合なエージェントのシステムです。当社のシステムは、スケーリングに対応可能な2つの補完的な役割で構成されています:

  • ワーカーエージェント – これらのエージェントは、エンジニアリングチームにおける個人貢献者のデジタルな対応体として機能します。明確に定義された境界内で自律的に動作し、開発、テスト、デバッグ、運用といったエンジニアリングの意図に基づいてタスクを計画し実行します。チームの成熟度や複雑さによっては、デプロイメントには単一のワーカーエージェントが関わる場合もあれば、動的に調整された複数のワーカーエージェントの群れが関わる場合もあります。

ワーカーエージェントは以下の能力を有します:

  • 推論モデルを用いてユーザーの意図を解釈し、実行可能な計画に変換する。
  • ソースリポジトリ、イシュートラッカー、ログなどの内部ナレッジベースといった「記録システム(systems of record)」から必要なコンテキストを取得する。
  • ツール、コーディングエージェント、またはカスタム/サブエージェントを通じてワークフローを実行する。
  • 正確性と完全性を確保するために結果を検証する。
  • 透明性、説明責任、追跡可能性を確保するため、リーダーシップレイヤーに対して計画、行動、結果を報告する。

ワーカーエージェントは意図的に疎結合(loosely coupled)に設計されており、水平方向のスケーリング、新しいワークフローへの適応、そして必要に応じてスワーム内の他のエージェントへタスクを委譲することが可能である。

  • リーダーエージェント – これらのエージェントは、プロジェクトリーダーのデジタル版として機能します。これらは、エージェント群全体で調整、統治、共有機能、可視性を提供します。リーダーエージェントは以下の役割を果たします:
  • ベストプラクティスを標準化し、オンボーディングの摩擦を劇的に低減する、共有のプロンプトおよびワークフローライブラリ。
  • ワーカーエージェントに対して承認された機能を一貫性かつ安全に公開する、共通のツールゲートウェイ。
  • エージェント群全体の長期記憶。これにより、時間経過に伴う学習と継続的な改善が可能になります。
  • エージェントのアクティビティ、意思決定、結果へのグローバルな可観測性。これにより、システムの動作とパフォーマンスに関する洞察が得られます。
  • エージェントがいつ、どのように行動するかを決定するオーケストレーション。単に何を生成するかだけでなく、行動のタイミングと方法も制御します。
  • 実行と調整を分離することで、このフレームワークはエッジでの自律性を維持しつつ、スケールにおける一貫性を確保します。

以下の図は、アジェンティックエンジニアリングシステムの参照アーキテクチャを示しています。すべてのワーカーエージェントはA2Aプロトコルを介して通信します。ただし、ワーカーエージェントは、MCPラッパーを通じてA2Aをサポートしない他のエージェントとも相互作用する可能性があります。システムと対話するエンジニアは、IDEやCLI、またはGitHubやJiraのアクションを介した外部トリガーなど、好みのインターフェースを通じて意図を表現します。このシステムでは、ワークフローはチームの生産性ニーズに合わせてカスタマイズ可能です。

imageimage.png)

複数のアジェンティック・フレームワークを評価した結果、本調査ではLangChainのフレームワークを選択しました。これは、アジェンティック・エンジニアリングにおける生産環境での要件への適合性に基づいています。このフレームワークは、ステートフルで協調的、かつガバナンス可能なエージェント・システムの実行モデルであり、現実のエンジニアリングチームを模倣するAIシステムをオーケストレーションするのに適しています。私たちは、長期状態の保存にLangMemの抽象化を利用し、実行トレースのログ記録にはLangSmithを使用しています。これにより、エンドツーエンドの追跡可能性、テレメトリ、およびアジェンティック・ワークフローと成果物のシステム全体の可視性が可能になります。

マクロアーキテクチャビュー

以下は、これらのアジェンティック・システムがチーム境界をまたいでどのように機能するかを示す参考図です。エージェントのリーダーは、他のチームのリーダーと協力することができます。例えば、プロダクトマネジメントチームから提出された製品要件は、エンジニアリングチームのリーダーによって適切なワーカーエージェント(スウォーム)にルーティングされ、要件の計画策定と抽出が行われます。

image
image

LangChain を用いた技術的実装

この実装は、LangChain フレームワークのスイートが提供する3つの主要な抽象化概念——制御可能なエージェントオーケストレーションのための LangGraph、エージェントの観測可能性と評価のための LangSmith、長期記憶を通じてエージェントが学習し改善するのを支援するライブラリである LangMem——を組み込み、評価しています。LangGraph の中核となる抽象化概念である「状態を持つノードのグラフ」は、エージェントによって生成された計画に基づいたカスタムワークフローの構築を可能にします。この評価は、アジェンティック・エンジニアリング(Agentic Engineering)を実験環境から安定した本番運用可能なオペレーティングモデルへ移行するための、以下の技術的特性に焦点を当てています:

  • ステップ、エージェント、リトライ全体で永続化する状態管理およびチェックポイント機能。
  • 誰が、いつ、なぜ決定を行ったかを追跡し、事後分析と継続的改善をサポートする監査証跡の提供。
  • 外部の記録システムおよび MCP スタイルのツールゲートウェイとのインターフェース互換性。
  • エージェントが認可されたアクションを実行していることを保証し、運用リスクを低減する決定論的実行モデル。
  • 異なるアジェンティック通信プロトコル、および他のフレームワークを使用して構築されたエージェントとの相互運用性。

LangGraph 支援型エージェント実行の使用

ワーカー エージェント間で技術的な問題のデバッグを行い、異なるチームにまたがるコミュニケーションを行うシナリオや、Codex や Claude といった AI コーディング エージェントを活用してワーカー エージェントと共同で開発を行うシナリオなど、エージェント間通信を伴ういくつかのシナリオを探求しました。下図は、後者のシナリオの詳細な例を示しています。この図は、自律的なロジックが存在する AI コーディング エージェントとワーカー エージェント間の相互作用を描いています。ワーカー エージェント内の自律的なロジックは、ほとんどのアジェンティック ワークフローに適用可能な論理的な 4 つの段階の進行に従います。このユースケースは、ワーカー エージェントがソースコードからのコンテキストを超えて文脈を取得し、他のエージェントに通知し、アジェンティックなアクティビティを追跡するためにどのように使用されるかを示しています。

  • インテント分析:IDE 内で自然言語としてエンジニアリングの意図を入力すると、そのリクエストはワーカーエージェントに送信されます。この場合、エージェントのワークフローは LangGraph を用いてオーケストレーションされ、MCP ツールを通じて意図の分析と関連コンテキストの取得が行われます。
  • 計画策定と通知:コンテキストが確立されると、エージェントは構造化された複数ステップの計画(図中の Step 1 から Step N)を生成します。この計画は、Slack、Teams、Webex などの通信チャネルを通じてエンジニアに通知されます。
  • 実行と追跡:計画は、IDE 内の AI コーディングエージェントとの協働により、1 ステップずつ実行されます。エージェントは、LangGraph のチェックポイント機能と状態追跡メカニズムを活用して、実行状態を追跡します。
  • 検証と完了:最終ステップでは、実行が完了した後、ワーカーエージェントはメモリにチェックポイントされた状態と一致する計画の実行が行われたことを検証し、ループを閉じます。結果は通信チャネルでの通知としてエンジニアに伝えられ、長期状態として LangMem に保存されます。

AI コーディングエージェントがネイティブな a2a(Agent-to-Agent)機能をサポートしていなかったため、AI コーディングエージェントからのリクエストをワーカーエージェントにルーティングする MCP アダプターツールを構築しました。このアプローチにより、システムは IDE に依存しないものとなっています。

imageimage.png)

ピロットスタディからの発見と観察

アジェンティック・エンジニアリングの実践的な影響を評価するため、私たちはこのフレームワークを実際の開発、テスト、デバッグのワークフローに適用しました。個々のタスクを最適化するのではなく、エージェントが連携する際に品質を損なうことなくスループットが改善されることを測定し、少なくとも2つのエージェント間の調整を必要とするワークフローを選択しました。開発およびデバッグ・ワークフローのベースラインを作成するため、エンジニアリングチームが集まってユースケースのリストを策定するブートキャンプを実施し、エージェントなしでこれらのワークフローを実行した場合の完了時間を歴史的証拠に基づいて算出しました。私たちは保守的に数値を報告していますが、実際にはさらに大きなGainが得られる可能性があります。

私たちはクロスチームのトリアージと根本原因分析を含む複数のデバッグ・ワークフローを評価し、QAチームによる独立した品質評価を行いました。主要指標として「根本原因特定までの時間」を用いた20以上のワークフローのピロットテストでは、歴史的なデバッグ時間と比較して全体で93%の削減が見られました。複数のクロスチーム調査は、調整されたエージェントの実行により5分以内に完了し、独立したQA評価によって確認されるように品質の低下は測定されませんでした。1ヶ月間に70人の一意のユーザーによって生成された512件のデバッグセッション全体から、クロス協調型アジェンティック・ワークフローを活用することで200人以上時間以上の節約が計算されました。

開発中心のワークフローでは、IDEベースのAIコーディングエージェントとワーカーエージェントを組み合わせました。これは必須ではありませんが、このシステムの主な利点は、バックエンドサービスからプロジェクト固有のコンテキストを取得し、より情報に基づいたコード生成やテストプラン作成を可能にすることでした。また、LangMemで長期状態を維持しつつ計画の責任をワーカーエージェントに移すことでテストを行い、以前のワークフローをインデックス化して再利用できるようにしました。これにより、反復タスクのオンボーディングオーバーヘッドが大幅に削減されました。

15以上の開発ワークフローにおいて、ワーカーエージェントを組み込んだ場合でも、歴史的なベースラインと比較して実行時間が65%以上削減されました。重要なのは、主要な改善点がすでにAIコーディングエージェントが得意とする高速なコード生成だけでなく、PRマージ後の機能テストにおけるダウンストリームワークフローを協調的なエージェント実行によって圧縮することにもあったことです。PRレビュープロセス自体が、ヒューマンインザループによって導入されたボトルネックとなりました。

このシステムがAIコーディングエージェントと異なる点

CodexやClaudeのようなAIコーディングエージェントは、ソフトウェア開発を補完するいくつかの新しい機能を提供しています。しかし、これらのエージェントは、ここで説明したアジェンティックエンジニアリングシステムとは根本的に異なる抽象化レベルで動作します。

  • Codexクラスモデルは、多くの場合、Worker Agent内に組み込まれているか、ワークフローの構成要素として、推論やコード生成エンジンとして機能しています。
  • AIコーディングエージェントは、リポジトリの文脈において意図をコードに変換したり、コードのリファクタリング、説明、デバッグを行うことに優れていますが、ユーザー主導の対話ループ内で動作し、チームをまたぐワークフローの調整能力には限界があります。一方、このアジェンティック・エンジニアリングシステムは、開発者やチームの境界を越えて移動する緩く結合されたエンジニアリングチームのように振る舞うことを明示的に設計されています。
  • AIコーディングエージェントとそのサブエージェントは、並列機能を非常に高いパフォーマンスで実行できます。このブログ記事で紹介されたシステムは、LangChainのフレームワークを活用して構築されたもので、ソフトウェアエンジニアリングパイプラインにおいてソフトウェアを迅速に提供するためのエンドツーエンドのアジェンティック・エンジニアリングを調整する明示的なコントロールプレーンです。

結論

Agentic engineering(エージェント型エンジニアリング)は、実際のエンジニアリングチームのように振る舞うAIシステムを中心に業務を再編成し、彼らの得意な分野を活用することで、ソフトウェアの構築方法に根本的な変化をもたらします。私たちの研究から、Agentic engineering の主な影響はタスクの加速という漸進的なものではなく、組織内でのソフトウェアの流通プロセスにおける構造的な変化にあることが示唆されています。これは調整オーバーヘッドの圧縮、チーム間のレイテンシーの削減、コンテキストの共有、そして人間の注力が最も価値を持つ場所の再定義を意味します。LangGraph などのフレームワークは、コラボレーション、メモリ、可観測性を第一級の関心事として扱うことで、この運用モデルを実践的なものとしています。Agentic engineering フレームワークの利点は、エンジニアによる最小限の設定でソフトウェアデリバリーパイプラインへの迅速な参入が可能になる点にあります。エージェントが設定されると、複数のチームがワーカーエージェントを活用して、内部および外部のツールからコンテキストを取得できます。その結果得られるのは、単にコード生成が速くなることではなく、より強靭でスケーラブル、かつ根本的に異なるソフトウェアデリバリーの方法です。

関連コンテンツ

image
image

Agent Architecture(エージェントアーキテクチャ)

Deep Agents(ディープエージェント)

Open Source(オープンソース)

バックグラウンドでのサブエージェントの実行

image
image
image
image

H. Lovell,

C. Francis

2026年4月16日

image
image

4分

imageimage.png)

LangChain

パートナー

開発者の最初の10分:Cisco AI DefenseでLangChainエージェントを安全に保護する

image
image

Siddhant Dash

2026年4月16日

image
image

4分

image
image

企業アナウンスメント

パートナー

LangChainとMongoDBのパートナーシップ発表:すでに信頼しているデータベース上で動作するAIエージェントスタック

image
image

LangChainチーム

2026年3月31日

image
image

6分

image
image

エージェントの実際の動作を確認する

LangSmith は当社のエージェントエンジニアリングプラットフォームであり、開発者がすべてのエージェントの意思決定をデバッグし、評価の変更を確認し、ワンクリックでデプロイできるよう支援します。

原文を表示

.png)

Key Takeaways

  • What is agentic engineering? Agentic engineering is a multi-agent coordination model where AI agents act as digital team members — each with defined roles, shared memory, and a common observability layer — to move software through the full delivery pipeline, not just generate code faster.
  • What results can multi-agent systems produce in software delivery? In a pilot of 20+ debugging workflows, coordinated agent execution produced a 93% reduction in time-to-root-cause compared to historical baselines, with over 200 engineering hours saved across 512 sessions in a single month. Development workflows showed a 65% reduction in execution time, with the biggest gains coming from compressing downstream testing — not code generation.
  • How does agentic engineering differ from AI coding agents like Codex or Claude? AI coding agents excel at translating intent into code within a single user-driven session. Agentic engineering operates at a higher level of abstraction: it's a control plane that orchestrates cross-team workflows, maintains long-term memory across agents, and manages state and traceability across the full software delivery lifecycle. The two aren't competing — coding agents like Codex can run inside the worker agents as reasoning and code-generation engines.

*This is a guest post from Renuka Kumar, Ph.D, Principal Software Engineer (Director) @ Cisco and Prashanth Ramagopal, Senior Director of Engineering @ Cisco. The opinions expressed in this blog are the authors views and not those of Cisco.*

‍

Software development has entered a new phase—one where intelligent agents operate not as isolated tools, but as coordinated entities mirroring real-world teams. As AI adoption accelerates, the focus has shifted from *what is possible* to *what works in practice*. Every software engineering stage—requirements, design, development, security, testing, deployment, and operations is amenable to partial automation at the very least, and may even support full end-to-end orchestration when agents collaborate cross-functionally. This goal then shifts from *“How do we write code faster?”* to *“How do we move software through the system faster and safely?” *Through experimentation with multiple agentic frameworks, we have identified practical patterns that deliver real, measurable impact.

This blog describes an agentic engineering system designed to transition from task level execution to system-level collaboration. We propose a reference architecture and a pilot evaluation of a multi-agent coordinated framework implemented using LangChain’s suite of tools—including LangSmith and LangGraph. What this system is not is a “better coding AI,” or a “better task assistant”. This architecture is designed to function as a control plane for multi-agent coordination, focusing on end-to-end software delivery.

Agentic Engineering to Mirror Real-world Engineering

Our core insight is simple:

*“The biggest step change doesn’t come from better tools alone. It comes from systems that mirror real-world teams.”*

At the core of the agentic engineering is a collaborative system of intelligent agents designed to mirror how engineering teams plan, execute, and deliver software. Rather than treating AI as a collection of isolated assistants, this framework models agents as team members— each with defined responsibilities, shared context, and accountability— coordinated through a lightweight but powerful leadership layer.

This system provides a native control plane for multi-agent coordination with the ability to:

  • Execute long-lived workflows
  • Retain agent memory that is shareable between teams
  • Chain different types of workflows together that can move across team boundaries
  • Facilitate knowledge sharing to onboard new team members to agentic workflows
  • Global observability into workflows executed agentically for traceability and auditability

Architecture

At a high level, the system is a loosely coupled system of agents that can either operate as independent entities or as an entity within a swarm of agents. Our system consists of the two complementary roles that can be adapted to scale:

  • Worker Agents – These agents function as digital counterparts to individual contributors on an engineering team. They operate autonomously within well-defined boundaries, planning and executing tasks based on engineering intent—such as development, testing, debugging, or operational. Depending on team maturity and complexity, a deployment may involve a single worker agent or a dynamically coordinated swarm of worker agents.

A Worker Agent is capable of:

  • Interpreting user intent and translating it into an executable plan using a reasoning model.
  • Gathering the required context from systems of record such as source repositories, issue trackers, and internal knowledge bases such as logs.
  • Executing workflows through tools, coding agents, or custom/sub agents.
  • Validating outcomes to ensure correctness and completeness.
  • Reporting plans, actions, and results to a leadership layer to ensure transparency, accountability, and traceability.

Worker Agents are intentionally loosely coupled, enabling them to scale horizontally, adapt to new workflows, and—when necessary—delegate tasks to other agents in the swarm.

  • Leader Agent – These agents act as the digital analogue of a project leader. They coordinate, govern, and provide shared capabilities and visibility across a swarm of agents. The Leader Agent provide:
  • A shared prompt and workflow library that standardizes best practices and dramatically lowers onboarding friction.
  • A common tool gateway that exposes approved capabilities to worker agents in a consistent and secure manner.
  • Long-term memory for the swarm, enabling learning and continuous improvement over time.
  • Global observability into agent activity, decisions, and outcomes, providing insight into system behavior and performance.
  • Orchestration to determine when and how agents act, not just what they produce.
  • By separating execution from coordination, the framework preserves autonomy at the edges while maintaining coherence at scale.

The diagram below shows a reference architecture for the agentic engineering system. All our worker agents communicate via the A2A protocol. However, the work agents may also interact with agents that do not support A2A via an MCP wrapper. Engineers interacting with the system express an intent through their preferred interface—such as an IDE or CLIs, or an external trigger via a GitHub or Jira action. In this system, workflows are customizable to meet the productivity needs of the teams.

.png)

After evaluating multiple agentic frameworks, we selected LangChain’s framework for this study based on how they map to production requirements for agentic engineering. It is an execution model for stateful, collaborative, and governable agent systems, which makes it suitable for orchestrating AI systems that mirror real-world engineering teams. We use LangMem abstractions to store long-term state, and use LangSmith to log execution traces, enabling end-to-end traceability, telemetry, and a system-wide view of agentic workflows and outcomes.

Macro Architectural View

Below is a reference diagram for how these agentic systems can span cross team boundaries. Agent leaders can collaborate with leaders of other teams. For instance, a product requirement coming from the product management team can be routed by the engineering team leader to the right worker agent (swarm) for planning and extracting requirements.

Reference Technical Implementation with LangChain

This implementation incorporates and thus evaluates three core abstractions provided by the suite of LangChain’s framework – LangGraph (for controllable agent orchestration), LangSmith (for agent observability & evals), and LangMem (a library that helps agents learn and improve via long-term memory). LangGraph’s core abstraction—a graph of stateful nodes—enables the construction of custom workflows based on a plan generated by the agent. The evaluation focused on the following technical characteristics for transitioning agentic engineering from experimental environments to stable, production-ready operating models.:

  • State management and checkpointing capabilities that persist across steps, agents, and retries.
  • Provision for audit trails to track who decided what, when, and why, supporting post-hoc analysis and continuous improvement.
  • Interface compatibility with external systems of record and MCP-style tool gateways.
  • Deterministic execution model that ensures that agents are performing authorized actions to reduce operational risk.
  • Interoperability across different agentic communication protocols and with agents built using other frameworks.

Using LangGraph assisted agentic execution

We explored several scenarios that involved agent to agent communication such as debugging technical issues with worker agents spanning across different teams and leveraging AI coding agents like codex or claude to collaborate with the worker agent for development. We detail an example of the latter scenario in the diagram below. The diagram depicts the interaction between the AI coding agent and the worker agent where the autonomous logic resides. The autonomous logic within the worker agent follows a logical four-stage progression applicable to most agentic workflows. This use case demonstrates how worker agents can be used to retrieve context that extend beyond context from source code, to notify other agents, and to trace agentic activity.

  • Intent Analysis: Upon entering an engineering intent in the IDE as natural language, the request is sent to a worker agent. The agent’s workflow, in this case, is orchestrated using LangGraph to analyze the intent and retrieve relevant context via MCP tools.
  • Planning and Notification: Once the context is established, the agent generates a structured, multi-step plan (Step 1 through Step N in the diagram). The plan is notified to the engineers via a communication channel (e.g., Slack, Teams, or Webex).
  • Execution and Tracking: The plan is then executed one step at a time in collaboration with the AI coding agent in the IDE. The agent leverages LangGraph’s checkpointing and state tracking mechanism to track execution state.
  • Validation & Closure: In the final step, once execution is complete, the worker agent closes the loop by validating that the plan executed matches the state of execution checkpointed in memory. The results are communicated to engineers as notification in their communication channel and saved in LangMem as long term state.

Given how the AI coding agent did not support native a2a capabilities, we built an MCP adapter tool that routed requests from AI coding agent to the worker agent. This approach thus makes the system IDE-agnostic.

.png)

Findings & Observations from Pilot Study

To evaluate the practical impact of agentic engineering, we applied this framework to real-world development, testing, and debugging workflows. Rather than optimizing individual tasks, we measured improvements in throughput without loss of quality when agents collaborated, selecting workflows that required coordination between at least two agents. To curate our baseline for our development and debug workflows, we conducted a bootcamp where our engineering teams huddled together to curate a list of use cases and computed the time it took to complete these workflows if they were to execute them without agents, based on historical evidence. We report numbers conservatively, in reality the gains maybe more.

We evaluated several debugging workflows that involve cross-team triage and root-cause analysis, with independent quality assessment by our QE team. Using time-to-root-cause as the primary metric, a pilot of 20+ workflows showed an overall 93% reduction relative to historical debug times. Several cross-team investigations completed in under five minutes of coordinated agent execution, with no measurable loss of quality as confirmed by an independent QE assessment. From a total of 512 debug sessions generated by 70 unique users in a span of a month, we computed over 200 man hours saved by leveraging our cross collaborative agentic workflows.

For development-focused workflows, the setup paired an IDE-based AI coding agent with our worker agent. Though this is not required, a key advantage of this was the system’s ability to retrieve project-specific context from our backend services, enabling more informed code generation and test plan generation. We also tested by shifting the planning responsibilities to the worker agent while maintaining long-term state in LangMem, allowing prior workflows to be indexed and reused. This significantly reduced onboarding overhead for repeat tasks.

Across 15+ development workflows, we observed over 65% reduction in execution time compared to historical baselines even with the worker agent in the equation. Importantly, the primary gains were not limited to faster code generation—which AI coding agents already perform well—but from compressing downstream workflows for functional testing after PR merge through coordinated agent execution. PR review process itself became the bottleneck introduced by human-in-the-loop.

How This System Differs from AI Coding Agents

There are several new capabilities offered by AI coding agents like Codex and Claude that augments software development. However, these agents operate at a fundamentally different level of abstraction than the agentic engineering system described here.

  • Codex-class models are often embedded within Worker Agents or as a component in the workflow as reasoning or code-generation engines.
  • While AI coding agents excel at translating intent into code, refactoring, explaining or debugging code in the context of a repository, they operate within a bounded user-driven interaction loop and is limited in its ability to orchestrate cross-team workflows. In contrast, this agentic engineering system is explicitly designed to behave like a loosely coupled engineering team that moves across developer and team boundaries.
  • AI coding agents and its subagents can perform parallel functions extremely well. The system introduced in this blog post is an explicit control plane for orchestrating end-to-end agentic engineering to move software quickly in the software engineering pipeline, for which we leveraged LangChain’s framework.

Conclusion

Agentic engineering represents a fundamental shift in how software is built by reorganizing work around AI systems that behave like real engineering teams and by leveraging what they can do well. Collectively, our study suggest that the primary impact of agentic engineering is not incremental task acceleration, but a structural shift in how software moves through the organization—compressing coordination overhead, reducing cross-team latency, sharing context, and redefining where human attention is most valuable. Frameworks like LangGraph make this operating model practical by treating collaboration, memory, and observability as first-class concerns. The benefit of the agentic engineering framework is the noticeable ease of ramp up into the software delivery pipeline with minimal setup required by engineers. Once the agents are configured, multiple teams can leverage the worker agent to fetch context from tools, both internal and external. The result is not faster code generation, but a more resilient, scalable, and fundamentally different way of delivering software.

Related content

Agent Architecture

Deep Agents

Open Source

Running Subagents in the Background

H. Lovell,

C. Francis

April 16, 2026

4

min

.png)

LangChain

Partner

A Developer’s First 10 Minutes: Secure LangChain Agents with Cisco AI Defense

Siddhant Dash

April 16, 2026

4

min

Company Announcements

Partner

Announcing the LangChain + MongoDB Partnership: The AI Agent Stack That Runs On The Database You Already Trust

The LangChain Team

March 31, 2026

6

min

See what your agent is really doing

LangSmith, our agent engineering platform, helps developers debug every agent decision, eval changes, and deploy in one click.

この記事をシェア

関連記事

Amazon Science★42026年6月9日 04:00

実世界における自律型 AI の基盤

Amazon Science は、2026 年に AI が単なる知識を持つモデルから、物理世界で計画・ツール使用・多段階タスク実行を行う自律型エージェントへと転換する決定的な変化が訪れると発表しました。

MarkTechPost★42026年6月8日 17:25

Google Research、Gemini Enterprise Agent Platform にアジェンティック RAG と多段クエリ対応の充分文脈エージェントを追加

Google Research チームは、企業検索の課題である複数ソース・多段クエリへの対応を目的とした新しいアジェンティック RAG 枠組みを Gemini Enterprise Agent Platform に実装し、クロスコーパス検索機能を公開プレビューとして提供開始した。

AI News★42026年6月5日 20:34

C3 AI エージェントがシェル石油の予知保全を自動化する仕組み

エネルギー大手のシェル石油は、既存の C3 AI リライアビリティ・スイートを活用し、3 万点以上の設備監視から一歩進み、自律型 AI エージェントを導入して予防保全のライフサイクル全体を完全自動化する方針を明らかにした。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む