エージェント型インターフェースの進化：Claude Managed Agents を活用した構築（13 分読了）

エージェントを実環境に導入するには、優れたプロンプトだけでは不十分です。エージェントには、自身が生成したコードを実行する場所、データへのアクセスに必要な認証情報、観測可能なセッション、そして利用状況に応じてスケールできるインフラストラクチャが必要です。Applied AI チームでは、製品・研究・Claude を基盤に構築する顧客の三者が交差する領域で活動していますが、同じパターンを繰り返し目にします。つまり、プロトタイプと実環境のエージェントを分けるのはインフラストラクチャなのです。あまりにも多くのチームが、セキュリティ、状態管理、権限付与、ハッチの調整といった課題に開発サイクルを浪費してしまいます。 [Claude Managed Agents](https://platform.claude.com/docs/en/managed-agents/overview?utm_source=tldrai) は、本番グレードのエージェントを構築・展開するためのコンポーザブルな API のスイートであり、パフォーマンスに最適化されたエージェントハッチと本番インフラストラクチャを組み合わせています。これにより、チームは数ヶ月ではなく数日でプロトタイプからローンチへと移行できます。この記事では、Anthropic のエージェント用ビルディングブロックの進化、Claude Managed Agents を構築した理由、そして現在どのようにして実環境で活用されているかについて解説します。 ## エージェントアーキテクチャの進化 2023 年に Claude を開発者に公開した際、API はあえてシンプルに設計されました：トークンを入力し、トークンを出力するだけです。プロンプトを送信すると、Claude が完成文を返すため、ハッチと基盤となるインフラストラクチャは利用者が構築する必要がありました。 API は年々豊かになっていきましたが、その裏にある契約は変わっていませんでした：1 つのリクエストに対して 1 つのモデルターン（応答）があり、次に何が起こるかはアプリケーションが決定するのです。長い間、それで十分でした。文書の要約、サポートチケットの分類、テキストブロックの書き換えなど、単一のターンに収まるような作業には適していました。 しかし時が経つにつれ、人々が任せたかったタスクはもはやその枠に収まらなくなりました。彼らは Claude にタスクを最初から最後まで任せたいと考えました。何かを検索し、それに基づいて行動し、何が変わったかを確認し、次に何をすべきかを判断してほしいのです。そして、それがコードベースや社内ウィキ、チケット管理システムなど、すでに業務で使われているシステムの中で動作することを望んでいました。 API を用いる場合、Claude をエージェント化するには独自のループを構築する必要がありました：モデルに何をするか問いかけ、ツールを実行し、その結果をフィードバックして繰り返すのです。エージェントの骨組み（スキャフォールディング）を構築・デプロイする責任はユーザーにあり、モデルが進化するにつれて調整が必要になることもあります。完全なカスタマイズが必要なエージェントにとってはこのアプローチは理にかなっています。しかし、より予測可能で複雑さが低いエージェントワークロードにおいては、モデルや製品が進展するにつれてハーンネス（制御枠組み）を最適化することは次第に面倒なものになっていきました。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298c28f950480f89a8dfcf_01%20_%20Messages%20API.png) [Claude Code](https://code.claude.com/docs/en/overview?utm_source=tldrai) は、2025 年にリリースしたエージェント型コーディングツールで、Claude がコードベースと直接対話できるようにするものです。このツールには、ループ、ツール実行、サブエージェント、コンテキスト管理、そして効果的なエージェントとしての機能を実現する豊富な能力など、私たちが独自に構築したハーンセス（基盤）が含まれていました。開発者たちは自然と、さまざまなドメインで自分たちのエージェントにも同様のハーンセスの仕組みを求めました。 Claude Code のハーンセスの上にエージェントを構築できるようにするために、私たちは [Claude Agent SDK](https://code.claude.com/docs/en/agent-sdk/overview?utm_source=tldrai) をリリースしました。Claude Agent SDK は、開発者が独自のエージェントを構築するためのツールを提供します。これにより、開発者は独自のループを維持するのではなく、Claude Code を実行しているのと同じ基盤上でエージェントを構築できるようになります。多くのチームにとって、これがエージェントを実用的なものにする転換点となりました。ハーンセスは Claude 向けにすでにチューニングされており、インフラストラクチャのプリミティブ（基本要素）を提供しており、Claude Code の進化とともに継続的に改善されていきます。 しかし、ハーンセスがあったとしても、本番環境へのエージェントのデプロイにはいくつかの理由から課題が残ります。 - ホスティングとスケーリング。エージェントはどこで実行され、数時間にわたるタスクにおいてプロセスはどれほど長く生存可能か、利用が増加した際にどのようにスケールするか。 - セッション管理。エージェントの履歴と進捗はどこに保存されるのか？実行中に中断があっても再開できるか、過去のセッションを遡って内容を検査できるか。 - ファイルシステム管理。実際の作業を行うには成果物の生成が必要である：コードの編集、ファイルの作成、出力の構築など。エージェントが作業するワークスペースはどこにあり、実行間においてそのワークスペースはどうなるのか。 - 実行の隔離。Claude が記述したコードはどこかで実行されなければならない。もし間違っていた場合の影響範囲（ブラスト・レイジ）はどの程度か、本番環境で実際に信頼できる境界線は何か。 - 認証情報。エージェントにはお客様のシステムへのアクセス権限が必要である。生成されたコードに機密情報が漏洩することなく、どのようにしてそのアクセス権を得るのか。 - 観測性（オバザビリティ）。エージェントが自律的に 1 時間動作し、予期せぬ行動をとった場合、そのすべてのステップを再構築できるか。 Agent SDK を用いることで、上記の生産環境インフラの多くの要素が Claude Code の仕組みを通じて提供される。エージェントは実際のファイルシステムで作業でき、セッション状態はローカルまたは外部ストレージに永続化され、観測性は OpenTelemetry 経由で既存のモニタリングスタックへエクスポート可能となる。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298c53aaeeee508f2b3166_02%20_%20Claude%20Agent%20SDK.png) しかし、チームがローカル開発から本番環境へとエージェントを構築するようになると、大規模展開と管理されたインフラによるデプロイが必要となりました。さらに、モデルとその周辺ハルネスが進化し、より長時間実行され、より多くのコードを実行し、より多くのシステムにアクセスし、より多くのアクションを実行するようになるにつれ、スケーラビリティ、セキュリティ、サンドボックス化の課題はますます複雑になっています。 これらの障壁のいくつかは、共通のアーキテクチャ上の選択に起因しています。エージェントハルネスは、通常、作業対象となるファイルシステムと同じコンテナ内で実行されます。コンテナは起動（起動コストが発生）しないと Claude が思考を開始できず、エージェントとコードの実行はあなたの認証情報と隣り合わせになり、コンテナが停止すると実行も同時に終了してしまいます。 Managed Agents は、[脳を手足から分離する](https://www.anthropic.com/engineering/managed-agents)ことでこれらの問題を解決します。Claude を呼び出すハルネスとコードを実行するサンドボックスは別々に動作し、セッション（すべてのモデル呼び出し、ツール呼び出し、および結果の追加のみ可能なログ）がこれら 2 つを結びつけます。Claude はコンテナが存在する前に推論を開始でき、サンドボックスは認証情報から遠く離れており、実行全体はいつでもそのセッションから再構築可能です。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298c97d4a887f2666a50b6_03%20_%20Claude%20Managed%20Agents.png) ## クロード管理型エージェントを使用するタイミングと理由 管理型エージェントを構築する際、ユーザーはタスク、ツール、およびガードレールを定義し、Anthropic は自社のインフラ上でエージェントを実行し、実行環境の提供方法やツールの呼び出し方、失敗時の回復策、マルチエージェントのオーケストレーションなど、背後にあるエージェントループを処理します。 ハネスがモデルの知能と並行して進化しない場合、[エージェントは機能不全に陥ります](https://www.anthropic.com/engineering/harness-design-long-running-apps)。Claude Sonnet 4.5 では、コンテキストの末尾に近づくとエージェントは完了を急ぎ、残された余地を活用するのではなく作業を短く切り上げてしまうというパターン、「コンテキスト不安」が見られました。私たちの対策として、ハネスにコンテキストのリセットを追加し、Claude が制限値付近で一貫性を保つために支援が必要だという前提を組み込みました。しかし、この前提は次のモデルでは生き残れませんでした。Claude Opus 4.5 ではその挙動は消え去り、私たちが追加したリセットは単なるオーバーヘッドとなりました。 ほとんどの組織にとって、ハネスの維持管理は製品の差別化につながらないオーバーヘッドです。ハネスは特定のモデルの動作に合わせて調整する必要があり、圧縮（compaction）、ツール実行、キャッシュといったプリミティブは、Claude では他のモデルとは異なる挙動を示します。Claude 管理型エージェントを使用すれば、ハネスがモデルと並行して進化するため、チームは自社のエージェントを差別化する要素に集中できます：**コンテキスト管理とドメイン専門知識**です。 開発者が効果的なエージェントを構築するために必要なコンテキストとツールを設定できるようにするため、Managed Agents は主に 3 つのリソースを中心に構築されています：エージェント、環境、セッションです。*エージェント*とは構成のことであり、モデル、プロンプト、ツールのセット、およびそれらを取り巻くガードレールから成ります。*環境*はエージェントが実行される実行コンテキストであり、サンドボックスコンテナ、ネットワークルール、そしてクラウド上でホストされているか、あるいはあなたが管理するインフラストラクチャ上に事前インストールされたパッケージを含みます。各実行は*セッション*と呼ばれ、エージェントと環境をペアにして、それぞれに独立したサンドボックスインスタンスを取得します。セッションはサーバーサイドで完全なイベント履歴、サンドボックスの状態、および出力を保持するため、長時間実行される作業は一時的に停止し、きれいに再開でき、事後にもステップごとに追跡可能です。Managed Agents を使用すれば、エージェントと環境を一度定義するだけで、ワークロードが成長しても同じ構成に対して多数のセッションを実行できます。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a29a18bb07e245f8389acb9_04%20_%20Agents_%20environments_%20sessions%20(2).png) ## Managed Agents での本番環境とスケーラビリティの構築 Applied AI 部門では、コーディング、財務、サポート、法務、そしてその他 dozen のドメインにわたって、エージェントがプロトタイプから本番環境へと移行する様子を目撃しています。これは Anthropic 社内および顧客システム内でのことです。これにより、デモと本番対応のエージェントを分けるものや、チームがしばしば行き詰まる箇所について明確な視点が得られています。 以下に、Claude Managed Agents のような管理型サービス上で構築する最も一般的な理由を共有します： **1. 認証情報はサンドボックスから隔離されます。** すべての処理が 1 つのコンテナ内で実行される場合、Claude が生成したコードは認証情報のすぐ隣に配置されるため、プロンプトインジェクションによってモデルが自身の環境を読み込むよう説得され、トークンが漏洩するリスクがあります。同じコンテナ内で堅牢なガードレールを設定することでこれを防ぐことも可能ですが、アーキテクチャを分離することで、認証情報をサンドボックスから完全に排除するという、より安全なアプローチが可能になります。MCP や CLI、GitHub リポジトリなどのツール用のトークンは別の Vault に保存され、プロキシが要求に応じてそれらを取得して復号化します。Managed Agents は [Vaults](https://platform.claude.com/docs/en/managed-agents/vaults?utm_source=tldrai) を提供しており、これにより独自に秘密情報ストアを運用したり、すべての呼び出しでトークンを転送したり、エージェントが誰の代理として行動したかを追跡できなくなったりする心配がありません。Vault の認証情報は保存前にエンベロープ暗号化で保護され、取得には検証用の署名付きリクエストトークンが必要です。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a29a19cebb4eb7adac0a8ec_05%20_%20Managed%20Agents%20runtime%20(1).png) **2. サンドボックスのオーバーヘッドを排除した低レイテンシ。** レイテンシは、ユーザーが Claude の応答待ちを強く感じるため、多くのエンタープライズチームにとって最優先の指標です。Managed Agents アーキテクチャがない場合、エージェントが思考のみを行いツールを実行しないセッションであっても、すべてのセッションに対してコンテナが起動する必要があります。このセットアップ時間は無駄であり、ユーザーは最初の応答までの遅延としてそれを体感します。Managed Agents を用いると、Claude は環境の並列起動中に即座に推論を開始し、ツールを実行しないセッションではコンテナを完全にスキップできます。これにより、ユーザーはコンテナ起動を待たずに最初のトークン（token）を確認でき、エージェントが何かを実行する必要がある頃には環境も準備完了しています。テスト結果によると、中央値（p50）では初回トークンまでの時間を約 60% 短縮し、最も遅いケース（p95）では 90% 以上短縮することが確認されました。 **3. セッション管理、観測可能性、およびメモリを可能にする信頼性が高く永続的なセッション。** リクエスト/レスポンスではなく、Managed Agents は *イベント* の観点で思考します。セッションは進行中のイベントストリームであり、すべてのモデル呼び出し、ツール呼び出し、結果は、エージェントを実行するプロセスの外に存在するログに追加されます。このアーキテクチャにより、エージェントが動作している間にイベントがストリーミングされるリアルタイム更新が可能になり、データベースやセーブポイントを管理することなく、いつでもセッションを再開できます。セッションを削除しない限り、対話間でも履歴は保持され、セッションがアイドル状態になるとコンテナがチェックポイント化されるため、中断した場所からきれいに再開できます。また、実行全体がすでにイベントの記録であるため、観測可能性とメモリも付随します：Claude Developer Console には、エージェントセッションのネイティブなビジュアルタイムラインビューと、トランスクリプトを詳細に調査できるデバッグ機能が用意されています。Managed Agents はさらに、Memory や Dreaming といった機能も提供しており、これらもこのセッションの永続性を利用しています。[Dreaming](https://platform.claude.com/docs/en/managed-agents/dreams?utm_source=tldrai) はスケジュールされたプロセスで、エージェントのセッションとメモリストアをレビューし、パターンを抽出して記憶をキュレーションすることで、エージェントが時間とともに改善できるようにします。Dreaming は、永続的なセッションログから読み取ることで、反復するミステイクやユーザーの嗜好から学習できるよう、セッション間で記憶を洗練させます。 **4. アスロピック管理型またはセルフホスト型のクラウドコンテナにおける柔軟性。** デフォルトでは、Managed Agents を使用すると、オーケストレーションとツールの実行の両方をアスロピック管理型のクラウドコンテナに委譲できます。これにより、ホスティングとスケーリングがシンプルで容易になり、プロダクションへの到達までの道筋をより速く提供します。Managed Agents では「脳」と「手」が分離されているため、「手」はあなたの仮想プライベートクラウド（VPC）内など、あらゆる場所に存在させることができます。そのため、ツールの実行に対する制御を望むチーム向けに [セルフホスト型サンドボックス](https://platform.claude.com/docs/en/managed-agents/self-hosted-sandboxes?utm_source=tldrai) も提供しており、これによりエージェントのコード、ファイルシステム、ネットワーク出口（egress）が環境から決して離れることがありません。また、Claude をプライベートネットワーク内で実行される Model Context Protocol (MCP) サーバーに接続できる [MCP トンネル](https://platform.claude.com/docs/en/agents-and-tools/mcp-tunnels/overview?utm_source=tldrai) も提供しています。つまり、セルフホスト型サンドボックスは「エージェントのコードがどこで実行されるか」を制御し、MCP トンネルは「アスロピックがネットワーク内の MCP サーバーにどのように到達するか」を制御するため、境界内に残す内容を正確に制御する能力を得ることができます。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298e427c7a804ea4295163_image7.png) *Claude Managed Agents の組み込み観測コンソールはすべてのイベントを記録するため、タイムラインを検索し、任意のステップを開いてその生ペイロードを読み取ることができます。*これらの機能に加え、成果物による自己評価（ルブリックに基づく）、マルチエージェントオーケストレーション、権限ポリシー、Webフックなどの追加機能も提供されています。詳しくは [こちら](https://platform.claude.com/docs/en/managed-agents/overview?utm_source=tldrai) をご覧ください。 ## 現在のカスタマーによる Managed Agents の活用事例 業界を問わず、カスタマーはすでに Claude Managed Agents を用いて本番環境でエージェントを稼働させています。いくつかの具体例をご紹介します： - Notion は、Custom Agents を Managed Agents で実行しています。チームはタスクボードから直接 Claude に作業を割り当て、Claude が各タスクに関連するドキュメント、議事録、接続されたデータを取得し、完成したコード、プレゼン資料、ウェブサイトがレビュー用にワークスペースに戻ってきます。数十のタスクが並列で実行され、チームによると初期プロトタイプでは約 12 時間の作業を 20 分に短縮できたとのことです。 - Rakuten は Managed Agents を活用し、製品、営業、マーケティング、財務の各分野に専門的なエージェントを、それぞれ約 1 週間以内に本番環境へ展開しました。 - Sentry は、Seer デバッグエージェントとパッチ作成および PR（プルリクエスト）発行を行う Claude エージェントを組み合わせています。これは単一のエンジニアによって数週間で構築され、従来なら数ヶ月かかったものを大幅に短縮しました。 - Asana はプロジェクト内のタスクを引き受ける AI Teammates を構築し、Atlassian は開発者エージェントを Jira のワークフローに組み込みました。 ## Claude Managed Agents の始め方 Managed Agents は、Claude Code と [platform.claude.com](http://platform.claude.com/?utm_source=tldrai) 上の Claude Developer Console を通じてエージェントを可能な限り簡単に立ち上げられるように構築されました。例えば、Console のクイックスタート機能を使えば、エージェントテンプレートから始めるか、自然言語でエージェントの概要を記述するだけで、数分でセキュリティ設定とデプロイが完了する本番環境対応のエージェントを作成できます。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298e9b866a4402a3c9bb5d_image5.png) *platform.claude.com のエージェントクイックスタート：テンプレートから始めるか、構築したいものを記述します。*![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298ebdff6d26839e052c63_image9.png) *数ステップ後：エージェントが作成され、環境が設定され、セッションが稼働します。Console は実行中のプロセスをストリーミング表示します。*Claude Code では、[/claude-api スキル](https://platform.claude.com/docs/en/agents-and-tools/agent-skills/claude-api-skill?utm_source=tldrai) がデフォルトで提供されており、Claude Managed Agents 上でアプリケーションを構築するための詳細かつ最新のリファレンス資料を Claude に提供します。Managed Agents アプリケーションの設定におけるベストプラクティスを活用するためにも、このスキルの利用を強く推奨します。新規の Managed Agent をゼロから設定するためのインタビュー形式のウォークスルーを開始するには、/claude-api managed-agents-onboard コマンドを実行してください。 ![image](https://cdn.prod.website-files.com/68a44d4040f98a4adf2207b6/6a298ef3765ce453971174cd_image6.png) ## 管理型エージェントの構築における未来 チームが Managed Agents（管理型エージェント）と共に取り組んでいる内容を共有するにつれ、以前は生産インフラストラクチャに費やしていた時間が、今では彼らのエージェントを差別化する要素に回されていることがわかります。具体的には、コンテキストの管理やユーザーへの体験の調整です。新しいモデルが登場した際も、アーキテクチャそのものに手を加えることなく、エージェントを更新してそれを使用し、評価（evals）を再実行し、改善点をリリースできます。 あなたが何を作るのか、楽しみにしています。 [Claude Managed Agents](https://platform.claude.com/docs/en/managed-agents/overview?utm_source=tldrai) で始める***。*** *この記事は、Anthropic の Applied AI チームに所属する Gagan Bhat と Isabella He によって執筆されました。彼らは、Hema Thanki、Jess Yan、Molly Vorwerck の貢献に対して感謝の意を表します。*

エージェント型インターフェースの進化：Claude Managed Agents を活用した構築（13 分読了）

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト