AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
LangChain Blog·2026年6月13日 01:59·約10分で読める

Box AI が Deep Agents を活用してエンタープライズ向けコンテンツエージェントを構築した方法

#エンタープライズ AI#Deep Agents#業務自動化#Box AI#コンテンツ管理
TL;DR

Box AI は Deep Agents という技術を採用することで、企業内の文書やデータ処理の自動化を強化するコンテンツ管理エージェントの開発・実装に成功した。

AI深層分析2026年6月13日 02:02
3
注目/ 5段階
深度40%
2
関連度30%
4
実用性20%
4
革新性10%
3

キーポイント

1

Deep Agents の導入と機能

Box AI が独自開発または採用した Deep Agents という技術を用いて、高度なエンタープライズ向けコンテンツ管理エージェントを構築しました。

2

業務自動化の強化

組織内部に散在する文書やデータの処理プロセスを自動化することで、業務効率とデータ活用能力が大幅に向上します。

3

エンタープライズ対応

大規模な企業環境におけるセキュリティと管理要件を満たす形で、AI エージェントを実装・運用可能となりました。

影響分析・編集コメントを表示

影響分析

このニュースは、AI エージェント技術が単なる実験段階から、実際の企業業務フローに組み込まれる「実装フェーズ」へ移行したことを示しています。特に文書管理という堅牢な領域で自動化が進むことは、RAG やエージェント技術のビジネス価値を裏付ける重要な事例となります。

編集コメント

「Deep Agents」という具体的な技術名が明記された点は、同社の独自戦略を示す重要な要素です。ただし、詳細な技術仕様や他社との比較情報が不足しているため、現時点では業界全体へのインパクトは限定的と判断されます。

Box AI の構築:Deep Agents を活用したエンタープライズコンテンツプラットフォームの AI ネイティブ化

image
image

Box は、構造化されていないデータを保存・保護・管理するために 10 万社以上のエンタープライズに信頼されているインテリジェントなコンテンツ管理プラットフォームです。Box AI の一部である Box Agent は、Deep Agents を基盤として構築されており、エンタープライズのコンテンツライブラリ全体を検索し、数千のドキュメントにわたる知見を統合してレポートや分析を生成します。その際も、Box の既存のセキュリティおよび権限モデルを完全に尊重します。

単一ファイルの Q&A からエンタープライズ規模の分析へ

Box Agent の最初のバージョンでは、ユーザーは単一のドキュメント内で質問を行うことができました。その後、チームは「ナレッジハブ(Knowledge Hubs)」を導入しました。これは RAG(Retrieval-Augmented Generation:検索拡張生成)ベースのレイヤーであり、定義された知識ソース全体を照会することを可能にします。

*「エージェントの開発を開始した際、私たちは検索の問題を解決したかったのです」と、Box のシニア AI アーキテクトである Sesh Jalagam 氏は説明しています。「エンタープライズ検索は困難です。なぜなら、重複する情報や古くなった情報が存在し、一見同じように見えるものの、各企業には独自の用語体系があるからです。」*

価値ある機能を提供する一方で、ユーザーは異なる分野にわたって次第に複雑な質問を投げかけるようになりました。バイオサイエンス企業の研究者が、新しい研究を開始する前に既存の研究資料を Box AI に要約させることを求めたり、法務チームが過去 10 年間で特定の金額を超える契約書すべてを抽出し、リスク評価基準に基づいて分析することを依頼したりすることがあります。より豊かな AI ネイティブな体験を実現するために、Box は標準的な Q&A を超えたエージェントアーキテクチャが必要でした。

制御性、モデルの柔軟性、および速度のために Deep Agents を選択

Box はエージェントプラットフォームを構築するにあたり複数のフレームワークを検討しました。この決定を形作ったのは 2 つの要件です。

  • モデル非依存性の完全な実現:Box は顧客に対して OpenAI や Anthropic から Google などまでの LLM プロバイダーを選択できる選択肢を提供しており、その柔軟性をプラットフォームレベルで維持する必要がありました。
  • イテレーションの速度:10 万人以上の企業顧客向けに Box Agent を立ち上げ改善するためには、Box チームはコアなエージェントインフラを再構築するのではなく、企業固有の問題にエンジニアリング時間を集中させる必要がありました。

Deep Agents はこの両方の要件を満たしました。モデル抽象化レイヤーがプロバイダー非依存のルーティングを処理し、オープンなエージェントハッチ(harness)によりイテレーション速度が 3 倍向上しました*。「すべての部品を完全に制御しながら、先見的なフレームワークの上に構築したかったのです」と Jalagam は述べています。

ディープエージェントアーキテクチャ:自身の子供を生成する親エージェント

Box エージェントのアーキテクチャは、親と子の両方がディープエージェント(Deep Agent)である親子モデルを採用しています。親(グローバルエージェントと呼ばれます)はリクエストを受け取り、意図を分類し、直接処理するか、または子エージェントを生成して作業を分散させるかを決定します。子エージェントは親に対してツールとして表現されるため、親がキーワード検索を実行する場合でも、新たに生成されたサブエージェントに委譲する場合でも、呼び出しインターフェースは一貫したまま保たれます。

この設計は、ハードコード化された専門的なサブエージェント(専用の検索エージェント、QA エージェント、およびコンポーズエージェント)を持つ以前のアーキテクチャからの意図的な進化です。これらは不要なレイテンシを生み出していました。「質問が非常に単純である場合や、検索が非常に単純である場合は、親ノードがそのまま処理すればよいのです」と Box の AI エンジニアリングリーダーである Shubhro Roy は述べています。「計画を立てる必要さえありません。」

複雑なタスクにおいては、動作は全く異なるものになります。例えば、過去 10 年間の契約書すべてを抽出し、閾値を超える金額のものについてリスク評価基準に照らして評価するよう指示された場合、グローバルエージェントは計画を立てた上で並列展開します。一つの子エージェントが関連文書の検索を行い、もう一つが並行して評価基準を取得し、残りの一つが前二つの完了後に結果を統合・分析します。これら 3 つのエージェント(またはタスクの要件に応じて任意の数)は、それぞれ独立したコンテキストウィンドウで実行され、ミドルウェア層を通じて結果を報告します。

子エージェントは事前に定義されたものではなく動的に生成されるため、Box の製品チームが明示的に設計していないタスクもシステムは処理できます。グローバルエージェントはランタイムにおいて、どの子エージェントを作成し、どのようなツールを与えるかを決定します。

親エージェントと子エージェントの両方が、BM25 キーワード検索、ベクトル検索(vector search)、スプレッドシート上の構造化された Q&A、ファイル操作などを含む、同じ完全なツールレジストリにアクセスできます。各リクエストごとに動的にツールのサブセットを選択しようとするのではなく、Box が見つけたのは、ユースケースが拡大するにつれて、どのツールを使用するかを決定する上で、静的なルーティングロジックよりもモデルの方が優れているという点です。

image
image

ミドルウェア:引用、キャッシュ、コンテキスト管理

Box は、モデル呼び出しとツール呼び出しをインターセプトする Deep Agents ミドルウェア を使用しています。ミドルウェアを使用すると、ガードレール、承認プロセス、動的なコンテキスト、およびその他のアプリケーション固有の動作を用いてエージェントループをカスタマイズできます。Box エージェントにおけるその機能のうち 3 つは以下の通りです。

引用生成。複雑で複数の文書にわたる回答を行う場合、引用はレスポンスストリーミング中に並列プロセスとして実行されます。ストリーミングされた回答が完了する頃には、引用も添付の準備が整っています。埋め込みベースのマッチングによりソースの帰属処理が行われ、引用が複数のソースに適切に分散されるようにするための組み込みロジックを備えています。*「ミドルウェアとして実装することの利点は、回答のストリーミングと引用生成が並列で実行されるため、ユーザーを中断させることがないことです」と、Roy は説明しています。

プロンプトキャッシュ。ミドルウェアは多回対話(マルチターン会話)にキャッシュ機能を注入し、会話履歴が蓄積するにつれてコストとレイテンシの両方を削減します。

コンテキスト管理。会話履歴が 170,000 トークンを超過した場合、ミドルウェアが自動的に要約を行い、エージェントロジックの変更を必要とせずにコンテキストオーバーフローを防ぎます。

ミドルウェアは、親エージェントと子エージェント間の通信チャネルとしても機能します。検索を完了した子エージェントは、その結果をミドルウェアを通じて書き込みます。親エージェントや他の子エージェントは、これらの結果を読み取り、それに基づいて行動することができます。これが、単一の実行プロセス内でエージェント間で中間成果物が流れる仕組みです。

反復の速度:数ヶ月から数週間に

Deep Agents の導入により、Box のエンジニアリングの速度が有意に加速しました。「以前は Box AI をゼロから完全に構築していたため、市場に出すまでに時間がかかりました」とジャラガム氏は強調しています。「現在のスタックでは、チームは数週間で新しいエージェントをリリースできます。

この加速は、アジェンシープラットフォーム自体内でも確認できます。ハードコードされた専門サブエージェントを持つ最初のエージェントアーキテクチャの開発とリリースには約 3 か月かかりました。その後採用された再帰的な親/子アーキテクチャでは、その 4 倍の速度で出荷されました。

Box エージェントの組織的知識の拡大

現在の Box エージェントの機能——企業横断検索、複数文書の合成、構造化レポート生成——は、ベテラン従業員のような組織的知識を持つ将来のエージェントの基盤です。「すべての要素を 10 年間理解しているような従業員を想像してください」とジャラガム氏は述べています。ロードマップには、エージェント内でのより豊かなメモリと知識構成、バックグラウンドでオフライン実行して情報を収集・提示する能力、および内部チームや外部システムとのより深いコミュニケーションが含まれています。

*Box のエージェントアーキテクチャについてさらに詳しく読む:*https://blog.box.com/how-box-built-its-ai-agent-langgraph* *

*エンタープライズコンテンツの上にエージェントを構築するには?*Deep Agents(深層エージェント)についてさらに詳しく学ぶ。*

‍

関連コンテンツ

image
image

事例研究

Deep Agents と LangSmith を活用して Scout を再構築し、リテンションを 4 倍に高めた Harmonic の取り組み

image
image

ソフィア・スリコフスキ(Sofia Sulikowski)

2026 年 6 月 3 日

image
image

8

分

image
image

事例研究

Deep Agents と LangSmith を活用し、6 ヶ月で全製品に AI ネイティブを浸透させた Rippling の取り組み

image
image

ソフィア・スリコフスキ(Sofia Sulikowski)

2026 年 6 月 1 日

image
image

6

分

image
image

事例研究

LangGraph(ラングラフ)

LangSmith(ランスミス)

チュートリアルとハウツー

LangGraph と LangSmith を活用したカスタマーサポート向けセルフサービス AI エージェントプラットフォームの構築 — Lyft の事例

image
image

アクシャイ・シャルマ

2026 年 5 月 27 日

image
image

10 分

image
image

エージェントが実際に何をしているかを確認する

LangSmith(エージェントエンジニアリングプラットフォーム)は、開発者がすべてのエージェントの意思決定をデバッグし、評価変更を行い、ワンクリックでデプロイできるように支援します。

原文を表示

Building Box AI: How an Enterprise Content Platform Went AI-Native with Deep Agents

‍Box is the intelligent content management platform trusted by 100,000+ enterprises to store, secure, and govern their unstructured data. The Box Agent, part of Box AI, is built on Deep Agents to search across an enterprise's content library, synthesize findings across thousands of documents, and produce reports and analysis, all while respecting Box's existing security and permissions model.

From Single-File Q&A to Enterprise-Scale Analysis

The first iteration of the Box Agent allowed users to ask questions within a single document. From there, the team introduced Knowledge Hubs, a RAG-based layer that let users query across a defined knowledge source.

*"When we started with agents, we wanted to solve the search problem," *explained Sesh Jalagam, Principal AI Architect at Box. *"Enterprise search is challenging, because you have duplicate information, outdated information, things that seemingly look the same but every enterprise has its own nomenclature." *

While valuable capabilities, users began to ask increasingly complex questions across different domains. A bioscience company's researchers might have asked Box AI to synthesize a body of existing research before starting a new study. A legal team might have asked to pull all contracts exceeding a certain value from the past decade and assess them against a risk rubric. For a richer AI-native experience, Box required an agentic architecture that went beyond standard Q&A.

Choosing Deep Agents for Control, Model Flexibility, and Speed

Box evaluated multiple frameworks when it set out to build its agent platform. Two requirements shaped the decision.

  • Complete model agnosticism. Box offers its customers a choice of LLM providers, from OpenAI and Anthropic to Google and others, and that flexibility had to be preserved at the platform level.
  • Speed of iteration. To launch and improve Box Agent for 100,000+ enterprise customers, the Box team needed to focus engineering time on the enterprise-specific problems rather than rebuilding core agent infrastructure.

Deep Agents satisfied both. The model abstraction layer handled provider-agnostic routing, and the open agent harness unlocked 3x speed of iteration.* "We wanted full control of all the pieces, while building on a forward-looking framework," *Jalagam said.

The Deep Agent Architecture: A Parent Agent That Spawns Its Own Children

The Box Agent’s architecture uses a parent/child model where both the parent and all children are Deep Agents. The parent (called the Global Agent) receives a request, classifies intent, and decides whether to handle it directly or spawn child agents to distribute the work. Child agents are expressed as tools to the parent, keeping the invocation surface uniform whether the parent is running a keyword search or delegating to a freshly spawned sub-agent.

This design was a deliberate evolution from an earlier architecture that had hardcoded, specialized sub-agents: a dedicated search agent, a QA agent, and a compose agent—which created unnecessary latency. *"If the question was very simple, or the search was very simple, the parent node can just do it,"* said Shubhro Roy, AI Engineering Leader at Box. *"It doesn't even need to come up with a plan."*

For complex tasks, the behavior looks entirely different. If asked, for example, to pull all contracts from the last 10 years with values exceeding a threshold and evaluate them against a risk rubric, the Global Agent produces a plan, then fans out. One child searches for the relevant documents, another retrieves the rubric in parallel, and a third synthesizes and analyzes the results once the first two complete. All 3 agents (or any number of agents, depending on what the task demands) run with isolated context windows, reporting back through the middleware layer.

Because child agents are spawned dynamically rather than predefined, the system handles tasks that Box's product teams haven't explicitly designed for. The Global Agent decides at runtime what children to create and what tools to give them.

Both parent and child have access to the same full tool registry, covering BM25 keyword search, vector search, structured Q&A over spreadsheets, file operations, and more. Rather than trying to dynamically select a subset of tools per request, Box found that as use cases expanded, the models were better at deciding which tools to use than any static routing logic.

Middleware: Citations, Caching, and Context Management

Box uses Deep Agents middleware that intercepts model and tool calls. Middleware lets you customize the agent loop with guardrails, approvals, dynamic context, and other application-specific behavior. Three of its functions for the Box Agent include:

Citation generation. For complex, multi-document answers, citations run as a parallel process during response streaming. By the time the streamed answer completes, the citations are ready to attach. Embedding-based matching handles source attribution, with built-in logic to ensure citations are distributed appropriately across multiple sources.* "The advantage of doing it as middleware is that the streaming of the answer and the citation generation happen in parallel, so you never interrupt the user," *explained Roy.

Prompt caching. Middleware injects caching on multi-turn conversations, reducing both cost and latency as conversation history accumulates.

Context management. When conversation history exceeds 170,000 tokens, middleware summarizes it automatically, preventing context overflow without requiring changes to agent logic.

Middleware also functions as the communication channel between parent and child agents. A child that completes a search writes its results through middleware; the parent and other children can read and act on those results. This is how intermediate artifacts flow between agents within a single execution.

Speed of Iteration: From Months to Weeks

Building on Deep Agents meaningfully accelerated Box's engineering velocity. *"Previously we built Box AI completely from the ground up, which meant more time to get something out in the market,” emphasized *Jalagam.* *With the current stack, the team can ship a new agent in a couple of weeks.

The acceleration also shows up within the agentic platform itself. The first agent architecture, with hardcoded specialized sub-agents, took roughly 3 months to develop and ship. The recursive parent/child architecture that followed shipped 4x faster.

Expanding Box Agent’s Institutional Knowledge

The Box Agent’s capabilities today—cross-enterprise search, multi-document synthesis, structured report generation—are the foundation for a future agent with the institutional knowledge of a tenured employee. *"Imagine an employee who has 10 years' worth of understanding of all the pieces going on,"* Jalagam said. The roadmap includes richer memory and knowledge composition within agents, the ability to run offline in the background collecting and surfacing information, and deeper communication with both internal teams and external systems.

*Read more about Box’s Agent Architecture: *https://blog.box.com/how-box-built-its-ai-agent-langgraph* *

*Building agents on top of enterprise content? Learn more about *Deep Agents*.*

‍

Related content

Case Studies

How Harmonic Rebuilt Scout on Deep Agents and 4x'd Retention with LangSmith

Sofia Sulikowski

June 3, 2026

8

min

Case Studies

How Rippling Went AI-Native Across Every Product in 6 Months with Deep Agents and LangSmith

Sofia Sulikowski

June 1, 2026

6

min

Case Studies

LangGraph

LangSmith

Tutorials & How-Tos

How Lyft Built a Self-Serve AI Agent Platform for Customer Support with LangGraph and LangSmith

Akshay Sharma

May 27, 2026

10

min

See what your agent is really doing

LangSmith, our agent engineering platform, helps developers debug every agent decision, eval changes, and deploy in one click.

この記事をシェア

関連記事

TLDR AI★32026年6月4日 09:00

顧客一人ひとりに対応するメタ・ビジネスエージェント

メタが、すべての顧客に対応するために「メタ・ビジネスエージェント」を発表した。これは AI を活用してカスタマーサポートを自動化・効率化する新サービスである。

TLDR AI★42026年6月19日 09:00

OpenAI が企業向け利用分析機能を導入(3 分読了)

OpenAI は、企業が自社の AI サービス利用状況を詳細に把握・管理できるよう、新たな企業向け利用分析機能を発表した。

TechCrunch AI★42026年6月18日 02:43

世界モデル開発企業オデッセイがアマゾンなど大手の支援を受け、14.5億ドルの評価額を獲得

世界モデルを開発するスタートアップ「オデッセイ」は、アマゾンや他の主要投資家からの出資により、企業価値が14.5億ドルに達したと発表した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む