AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
NVIDIA Developer Blog·2026年6月1日 13:21·約23分で読める

NVIDIA DOCA を用いたアジェンティック AI のインフラ強化とインシリコンセキュリティの進展

#Agentic AI#AI Security#In-Silicon Security#NVIDIA BlueField#AI Infrastructure
TL;DR

NVIDIA は、自律型 AI エージェントの台頭に伴う新たなセキュリティリスクに対処するため、BlueField DPU と DOCA を活用したイン・シリコン・セキュリティアーキテクチャを提案し、ホストシステムから独立したハードウェアベースの防御層を確立する方針を示している。

AI深層分析2026年6月11日 23:14
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

AI ファクトリの新たな攻撃対象領域

自律型 AI エージェントの普及により、インフラ、サプライチェーン、モデル、データ、エージェント自体が新たな攻撃面となり、機密性や完全性のリスクが高まっている。

2

従来のセキュリティアーキテクチャの限界

AI ファクトリのスケールと複雑さに対応するためには、分散型かつフルスタックな加速されたセキュリティが必要であり、従来のソフトウェア依存のアプローチでは不十分である。

3

BlueField DPU によるイン・シリコン・セキュリティ

NVIDIA BlueField DPU は、ホストシステムから独立した信頼実行ドメインで動作し、ハードウェアベースの強制力を持つセキュリティ層を提供することで、攻撃者によるポリシーの迂回や改ざんを防ぐ。

4

リスク検知とエグゼクションの分離

ホストが侵害された場合でも監視、ポリシー適用、テレメトリ機能は継続して動作し、セキュリティ機能が保護対象システムから隔離されることで信頼性が確保される。

5

従来のセキュリティモデルの限界克服

従来のエンドポイント保護は、保護対象環境と同じ信頼境界とリソースを共有するため、ホストが侵害された際に改ざんや回避の対象となりやすい。

6

BlueField によるオフロードとリソース分離

セキュリティ処理を BlueField シリコンにオフロードすることで、ホストの計算資源を消費せず、AI ワークロードとの競合も防ぎながら堅牢なフルスタック保護を実現する。

7

AI エージェント速度でのインシリコンセキュリティ

NVIDIA BlueField-4 DPU は、AI エージェントの高速な動作を妨げずに、ハードウェアレベルでセキュリティを提供します。

影響分析・編集コメントを表示

影響分析

この発表は、自律型 AI エージェントの普及に伴うセキュリティリスクへの対応として、ハードウェアレベルでの防御転換を促す重要な指針となる。従来のソフトウェア依存のアプローチから、インフラ自体に埋め込まれた信頼された実行環境へパラダイムシフトを図ることで、大規模な AI ファクトリの運用安全性を根本から再構築する可能性を示している。

編集コメント

自律型 AI の実用化においてセキュリティは最大のボトルネックの一つだが、NVIDIA がハードウェアレベルでの解決策を提示した点は業界にとって大きな前進である。特に「ホストが侵害されても機能し続ける」という特性は、ミッションクリティカルなシステム構築において極めて重要な価値を持つ。

AI エラは、前例のない規模で動作する自律型 AI エージェントにデータから知能を供給する AI ファクトリー という新たなインフラストラクチャのクラスを牽引しています。アクセレレーテッド・コンピューティング(加速計算)によって支えられた AI ファクトリーは、企業が AI をより高速かつ効率的にトレーニングし、ファインチューニングし、展開することを可能にします。

この新たなインフラストラクチャのクラスは、さらに権限を持つ自律型エージェントを含む、インフラストラクチャ、ソフトウェアサプライチェーン、モデル、データ、および自律型エージェントにまたがる根本的に新しい攻撃対象領域をもたらしました。自律型 AI の採用が加速するにつれ、敵対者は AI インフラストラクチャとそれによって駆動されるアプリケーションの両方を標的とするようになり、ミッションクリティカルなシステムの機密性、完全性、および可用性に対する新たなリスクを生み出しています。

従来のセキュリティアーキテクチャは、AI ファクトリーの規模、複雑さ、およびパフォーマンス要件のために設計されていません。この新しいインフラストラクチャを保護するには、分散型でフルスタックかつアクセレレーテッド(加速化)されたセキュリティが必要です。

本記事では、NVIDIA BlueField データ処理ユニット (DPUs) と NVIDIA DOCA が、ランタイム検出、データアクセス制御、およびアクセレレーテッド・ネットワーク強制執行を通じて、AI スケールでの AI インフラストラクチャ、ワークロード、エージェント、データを保護する方法について説明します。

組み込みセキュリティは従来のセキュリティモデルをどのように変えるのか?

AI インフラストラクチャ向けに設計された NVIDIA BlueField DPUs は、高性能ネットワーク、プログラム可能なコンピューティング、ハードウェアアクセラレーション、高度なセキュリティ機能を単一のプラットフォームに統合し、すべての AI ファクトリ計算ノードに埋め込まれています。従来のセキュリティアプローチがホストシステムソフトウェアに依存するのに対し、BlueField はハードウェアで強制される組み込みかつワークロードに依存しないセキュリティレイヤーを確立します。

BlueField は独自の信頼実行ドメイン内で動作し、インフラストラクチャとセキュリティサービスをホストシステムから分離します。監視、ポリシー適用、テレメトリは、ホストまたはワークロードが侵害された場合でも機能し続けます。セキュリティ機能が保護対象のシステムから隔離されているため、攻撃者は BlueField が強制するインフラストラクチャセキュリティポリシーを改ざんしたり迂回したりすることはできません。

このアーキテクチャは従来のセキュリティモデルを根本的に変えます。従来のエンドポイント保護は、保護対象環境と同じ信頼境界とシステムリソースを共有するため、ホストが侵害された際にセキュリティソフトウェアが改ざんや回避、無効化に対して脆弱になります。BlueField のシリコンへセキュリティ処理をオフロードすることで、ホストの計算リソースを消費したり AI ワークロードと競合したりすることなく、回復力のあるフルスタック保護を実現し、インフラストラクチャの最高効率と AI パフォーマンスを維持します。

imageimage*図 1. NVIDIA BlueField-4 DPU は、AI エージェントの速度で動作するイン・シリコンセキュリティを提供します*

NVIDIA BlueField と DOCA が AI ファクトリー全体を保護する方法

NVIDIA Vera Rubin プラットフォームにおいて、セキュリティは AI ファクトリー全体に分散され、インフラストラクチャ層に直接組み込まれます。NVIDIA BlueField-4 プロセッサは、すべての計算およびストレージシステムに埋め込まれています。これには、NVIDIA Vera Rubin NVL72 計算トレイ、Vera CPU 計算トレイ、LPX システム、そして Vera BlueField-4 STX ストレージシステム が含まれます。これにより、プラットフォーム全体にわたって一貫したハードウェア強制型のセキュリティ基盤が確立されます。

BlueField-4 シリコンを基盤とした、新たなクラスの NVIDIA DOCA セキュリティ機能により、AI のライフサイクル全体と Vera Rubin プラットフォームにわたる保護が拡張されます。AI モデル、コンテキストメモリ、データセット、ランタイムでのやり取りをいずれ守る場合でも、BlueField はあらゆるデータタイプ、あらゆるワークロード、そしてあらゆるエージェントをセキュリティで保護します。これには自律型エージェント自体の保護や、推論、トレーニング、および新興のエージェント AI ワークフローにまたがって権限を持つようになりつつあるエージェントから AI ファクトリーを守ることも含まれます。

NVIDIA DOCA セキュリティスタックは、AI ファクトリー全体を保護するための統一されたフレームワークを提供します。BlueField-4 のアクセラレーションを活用することで、DOCA はソフトウェアのみによるエージェントレスアプローチと比較して最大 1,000 倍高速なランタイム脅威検出を実現し、同時にネットワークおよびファイルアクセスポリシーを最大 800 Gb/s の速度で適用します。これにより、セキュリティは AI のスピードとスケールで動作することが可能になります。

imageimage*図 2. NVIDIA のエンドツーエンドの AI およびセキュリティアーキテクチャは、エージェント AI ファクトリー全体にわたって拡張されています*

DOCA セキュリティスタックには、DOCA Argus、DOCA Vault、および DOCA Flow が含まれており、これらはランタイム脅威検知、ファイルベースストレージに対するゼロトラストアクセス、高速なポリシーネットワークの強制といった専門的な機能を網羅しています。これらのフレームワークを組み合わせることで、AI ファクトリー全体における AI インフラストラクチャ、ワークロード、エージェント、およびデータを保護するための堅牢なセキュリティアーキテクチャが構築されます。

NVIDIA AI と統合された BlueField は、テレメトリデータとセキュリティデータを GPU 加速システムへストリームし、AI を活用した分析を行います。これにより、動的に保護を適応させ、DPU(Data Processing Unit)上で直接ポリシーを強制できる実用的なセキュリティインテリジェンスが生成されます。その結果、アジェンティック AI の速度、スケール、複雑さに最適化された、継続的に学習するセキュリティアーキテクチャが実現します。

DOCA Argus はどのようにして AI ワークロード内の脅威を検出するのか?

DOCA Argus は、AI ファクトリー全体にわたるリアルタイムの可視化と状況認識を提供するランタイム脅威検知マイクロサービスです。Argus は DOCA セキュリティスタックの基盤となります。

BlueField データおよびストレージプロセッサ上で実行される DOCA Argus は、高度なメモリ分析を用いてランタイム中のワークロード動作を継続的に監視します。これにより、組織は AI ワークロードのパフォーマンスに影響を与えることなく、脅威を検出し、整合性を監視し、運用状態を理解することが可能になります。

従来のホストベースのセキュリティアプローチとは異なり、DOCA Argus は保護対象となる計算ノードから独立して動作します。BlueField のハードウェア分離かつ検証可能な実行環境と DOCA の直接メモリアクセス機能を活用することで、Argus はソフトウェアエージェントに依存したりホスト CPU リソースを消費したりすることなく、システム活動の信頼できる真実源である特定の揮発性ホストメモリ領域を安全にアクセスします。ゼロコピーメモリアクセス技術を通じて、この検査はアプリケーションや AI のパフォーマンスを妨げることなく行われます。

DOCA Argus は自動的にホストシステムで実行されている Linux カーネルバージョンを特定し、分析に必要な正確なメモリ構造を検出するためにカーネル固有のメモリマップを適用します。x86 および Arm64 アーキテクチャの両方をサポートするこのプラットフォームは、ホストメモリストラクチャから低レベルのテレメトリデータを直接収集し、プロセス、スレッド、実行状態、ワークロード活動、システム動作に関する可視性を含む、生メモリデータを意味のある運用コンテキストに変換します。

ポリシーエンジンが収集されたテレメトリを継続的に分析し、意味のある運用およびセキュリティシグナルを特定するとともに、無関係な活動をフィルタリングします。これにより、システムの挙動、攻撃の指標、異常なランタイム状態に対するリアルタイムでの可視性が実現されます。セキュリティ上の発見事項は、運用上の認識と文脈的な可視性を提供する「イベント」と、調査または対応を要する即時的脅威や不審な行動を示す「アラート」に分類されます。

DOCA Argus は、メモリを継続的に分析して状態の変化や行動上の異常を検出することで、従来のホストベースのエージェントに依存することなく、永続的なランタイム監視を提供します。セキュリティ制御がホストから独立して動作するため、ワークロードやオペレーティングシステムが侵害された場合でも、検知機能は維持されます。同時に、フォレンジック証拠の継続的な収集により、潜在的なインシデントの調査が可能となり、事後分析を支援します。

imageimage*図 3. DOCA Argus は AI の脅威検出を監視します*

AI におけるランタイム整合性のモニタリング

AI アプリケーションは通常、コンテナとしてデプロイされ、同じイメージからインスタンス化されたワークロードは、一貫性があり予測可能な動作を示すことが期待されています。DOCA Argus はこの一貫性を活用して AI ワークロードの行動プロファイルを作成し、侵害や不正な活動、悪意のある行為を示す可能性のある逸脱をリアルタイムで監視することを可能にします。

DOCA Argus は、実行時に何が実行されているか、どのように実行されているか、そして何と相互作用しているかを監視することで、ランタイム整合性を継続的に検証します。これには、バイナリの動作やプロパティを実行時のマニフェストと比較すること、SHA-256 ハッシュを通じて整合性を検証すること、コマンドライン引数や実行パスなどの実行コンテキストを分析すること、スレッド、ライブラリ、ファイルシステム、ネットワーク、メモリとの相互作用を監視してワークロードが意図通りに動作していることを確認することが含まれます。

このプラットフォームは、ファイルアクセスとネットワーク活動に関するプロセスレベルの可視性を提供し、どのファイルがどのプロセスによってアクセスされ、どのようなアクションが実行されているかを継続的に監視します。インバウンドおよびアウトバウンドのネットワーク接続を分析して、ワークロードが期待される通信パターンを維持し、不審な動作を示さないことを保証します。

DOCA Argus は、実行中のリアルタイム活動を確立された行動ベースラインと比較することで、整合性の違反や侵害の兆候をリアルタイムで特定できます。検出機能には、例えば、不正なプロセスの実行、不正なライブラリの使用、ドリフトの検出、bash シェル実行、リバースシェルの活動、および侵害や悪意のある行動に関連するその他のランタイム異常が含まれます。

AI 発見とエクスポージャー管理

DOCA Argus はまた、AI ファクトリー全体における AI の発見とエクスポージャー管理のための基盤となる可視化レイヤーも提供します。このプラットフォームは、リアルタイムで AI インフラストラクチャ、ワークロード、およびそれらの関係を継続的に特定し、マッピングし、文脈化します。

これには、コンテナ(Kata コンテナを含む)、仮想マシン、およびベアメタルシステム全体でのワークロードの姿勢認識が含まれ、さらにコンテナから POD へ、コンテナから VM へ、コンテナからオペレーティングシステムへの依存関係など、インフラストラクチャコンポーネント間の関係をマッピングします。

コンテナイメージハッシュを使用することで、DOCA Argus は、実行中のアーティファクトを公開リポジトリや内部エンタープライズソフトウェアの在庫と相関させることで、展開された AI ソフトウェア、モデル、および自律エージェントの特定を支援できます。DOCA Argus のテレメトリーを活用することで、組織は、どの AI コンポーネントが実行されており、どこに展開され、環境全体でどのように相互作用しているかを可視化できます。

DOCA Argus は、実行されたバイナリおよび読み込まれたライブラリの SHA-256 ハッシュを分析することで、潜在的に脆弱なソフトウェアコンポーネントの特定を支援し、パッシブな脆弱性管理もサポートします。

AI 処理のサイバーセキュリティ運用への統合

DOCA Argus は、Fluent Bit や Vector などの標準的なテレメトリエクスポートメカニズムを通じて既存のサイバーセキュリティエコシステムとシームレスに統合され、組織がセキュリティテレメトリを SIEM、SOAR、XDR プラットフォーム、およびエンタープライズデータレイクへストリーミングして、その強化と分析を可能にします。

サイバーセキュリティチームは、主要なアーキテクチャ変更を必要とせずに、既存の分析、相関エンジン、脅威インテリジェンス、および自動化されたインシデント対応ワークフローを AI 環境へシームレスに拡張できます。サイバーセキュリティプロバイダーは、DOCA Argus のテレメトリを自社のセンサーからのデータとともに取り込んで正規化することで、AI ワークロードと加速されたインフラストラクチャを、脅威検出および調査のために従来の環境と同じ運用レンズを通じて監視することが可能になります。

重要なのは、DOCA Argus が抽出したテレメトリを運用上およびセキュリティに関連する情報に制限し、個人を特定できる情報(PII)を露呈させることなくプライバシーを保護している点です。

BlueField プロセッサ 1 つ上で動作する DOCA Argus は、計算ノード全体に対する包括的なランタイム監視と脅威検出を提供し、最小限の運用オーバーヘッドでインフラレベルの可視性と保護を実現します。BlueField のインシリコンセキュリティアーキテクチャと組み合わせることで、DOCA Argus は、パフォーマンス、効率性、または AI スループットを犠牲にすることなく、あらゆるワークロードをスケールして保護することを企業やクラウド AI ファクトリ構築者に可能にします。

DOCA Vault はどのようにリアルタイムデータアクセス制御を実現するのか?

DOCA Vault(Vault)は、ファイルベースの AI ネイティブストレージ向けに特別に設計されたデータセキュリティフレームワークであり、AI ファクトリ全体におけるデータのアクセス方法に対するリアルタイム制御を可能にします。DOCA Vault は、ホストオペレーティングシステムやストレージプラットフォームとは独立して、インシリコン内で微細な権限付与ポリシーを強制します。

これにより、ファイルベースのストレージに対するゼロトラストアクセス層が実現され、エージェント、トレーニングジョブ、推論サービス、および AI アプリケーションを含む、認可された AI ワークロードプロセスのみが、動作に必要な特定のデータにアクセスでき、かつ明示的に許可されたアクションのみを実行できることが保証されます。

ホストシステムに依存して実行される従来のアクセス制御とは異なり、DOCA Vault はストレージへのアクセス要求に対してインラインで動作し、ホストオペレーティングシステム、アプリケーション、またはストレージ層が侵害された場合でもポリシーの執行を維持します。このアーキテクチャにより、企業は多様なストレージインフラストラクチャ全体で一貫したセキュリティ制御を維持しながら、マルチエージェント AI 環境を安全にスケールさせることが可能になります。

DOCA Vault は、セキュアでポリシー駆動型のストレージアクセスに必要な可視性と執行機能を提供するために、DOCA Argus および DOCA SNAP(DOCA デバイスエミュレーション SDK を介して)と統合されています。DOCA SNAP は、PCIe バス上でローカルドライブをエミュレートすることで、ネットワーク化されたストレージをホストシステムに対してローカルファイルシステムデバイスとして提示します。その結果、オペレーティングシステムやハイパーバイザーは、要求が BlueField によって加速されたストレージフレームワークを通じて透明性高くリダイレクトされていることに気づいたまま、標準のストレージドライバーを使用し続けます。

このアーキテクチャにより、データアクセスが発生する前にファイルへのアクセス要求を傍受して評価することが可能になります。DOCA Vault は、DOCA Argus から収集されたコンテキストテレメトリをストレージ要求に付加することで、要求を開始したプロセス、対象となるファイル、および OPEN、READ、WRITE といった要求アクションに関する詳細な理解を構築します。これらのコンテキスト信号により、DOCA Vault は、適切な権限を持つ正しいワークロードプロセスのみが正しいファイルにアクセスすることを保証する、きわめて粒度の細かい認可ポリシーを執行することができます。

imageimage*図 4. DOCA Vault データセキュリティフレームワークは、ファイルベースの AI ネイティブストレージ向けに特別に設計されています

DOCA Vault は、従来の認可を超えた保護も提供し、AI ワークロードおよびストレージ環境に対してランタイム整合性制御を強制します。細粒度ポリシーにより、実行が許可されるプログラムの制限、不正なファイル作成の防止、ランタイムドリフトの抑制、ならびに不正なモデルまたはデータ流出のブロックが可能となります。ファイルアクセス動作を厳密に管理することで、Vault は攻撃者がワークロードやコンテナへの初期アクセスを獲得した後に実行できる行動を大幅に削減します。

エージェントが自律的に共有データセット、メモリ、およびモデルにアクセスするようになっているマルチエージェント AI システムにおいて、このレベルの制御は特に重要です。不正または予期せぬファイルアクティビティはリアルタイムでブロックされ、侵害の強力な指標として機能し、組織が AI ファクトリー内で悪意のある動作が拡散する前に検出することを支援します。

DOCA Vault はストレージセキュリティをインフラストラクチャ層に直接埋め込み、パフォーマンスを犠牲にすることなく、企業機密データセット、AI モデル、コンテキストメモリ、および知的財産を保護可能にします。BlueField-4 上でインライン実行される Vault は、最大の AI スループットとアプリケーション効率を維持しながら、リアルタイムの認可と保護を提供します

DOCA Flow はどのように高度なセキュリティサービスを加速するのか?

DOCA Flow は、DOCA ソフトウェアプラットフォーム内の基盤となるライブラリであり、開発者やサイバーセキュリティプロバイダーが BlueField プロセッサ上で高性能でハードウェアアクセラレーションされたパケット処理パイプラインを作成することを可能にします。プログラム可能な API を通じて、開発者はネットワークおよびセキュリティ操作をホスト CPU からオフロードしつつ、超低遅延と高スループットを維持しながら、ネットワークハードウェア内で直接実行されるパケット処理「パイプ」を定義できます。

DOCA Flow は、パケット検査、暗号化、フィルタリング、ポリシー適用をシリコン上で直接実行することで、アプリケーションや AI ワークロードのパフォーマンスに影響を与えることなく、ネットワークセキュリティが AI の速度とスケールで稼働することを可能にします。

DOCA Flow の中核的な用途の一つは、BlueField プロセッサを、組み込みの接続追跡機能を備えた高性能な Layer 4 ファイアウォールとして機能させるようにプログラムすることです。これにより、AI ファクトリー全体におけるフロントエンドとバックエンドのトラフィックに対するきめ細かい制御が可能となり、組織はネットワーク分離の強制、ワークロードの隔離、暗号化されたトラフィックを含むリアルタイムでの不正な通信経路の防止を実現できます。

DOCA Flow は、セキュリティプロバイダーが BlueField 上で高度なセキュリティサービスを直接加速することを可能にします。これには、層別ファイアウォール(Layer 7 firewalls)、AI セキュリティゲートウェイ、アプリケーション認識型インスペクション、および加速されたインフラストラクチャとエージェント AI 環境向けに特別に設計されたポリシー適用サービスが含まれます。

AI ファクトリがますます分散化・自律的なワークロードをサポートするためにスケールするにつれ、ネットワーク通信は重要な攻撃対象領域となっています。DOCA Flow は、セキュリティポリシーをインフラストラクチャ層内で直接適用することを可能にし、大規模な AI 学習と推論に必要なラインスピードパフォーマンスと効率性を維持しながら、脅威がシステム間で横方向に伝播するのを防ぎます。

エージェント AI ファクトリセキュリティのための NVIDIA DOCA の活用開始

NVIDIA DOCA セキュリティスタックの各コンポーネントは個別に強力なセキュリティ機能を提供しますが、DOCA Argus、DOCA Vault、および DOCA Flow を組み合わせることで、AI ファクトリ全体とエージェント AI のライフサイクルを保護するための統一されたインシリコンセキュリティフレームワークが構築されます。ランタイム可視性、ゼロトラストデータ保護、加速されたネットワーク適用を組み合わせることで、このスタックはパフォーマンスやスケーラビリティを犠牲にすることなく、AI インフラストラクチャ、ワークロード、エージェント、およびデータに対するエンドツーエンドのセキュリティを実現します。

NVIDIA BlueField プロセッサ上で連携して動作するように設計されたこれらの相互運用可能なサービスは、テレメトリ、ポリシーコンテキスト、および強制機能の共有を通じて、インフラストラクチャ、ワークロード、データ、ネットワーク通信全体にわたって協調した保護を提供します。

その結果、アジェンティック AI 向けの設計段階からセキュリティを考慮したアーキテクチャが実現されます。これは信頼性を継続的に検証し、インフラストラクチャの速度でポリシーを強制し、現代のアクセラレーテッドコンピューティングが要求する規模とパフォーマンスで AI ファクトリーを保護するものです。詳細については、DOCA を用いたセキュアな AI インフラストラクチャの構築をご覧ください。また、NVIDIA DOCA とアクセラレーテッドインフラストラクチャについてさらに深く掘り下げることも可能です。

AI インフラストラクチャの未来について詳しく知るには、NVIDIA の創設者兼 CEO であるジェンソン・ファン(Jensen Huang)による NVIDIA GTC Taipei 2026 キーノートにご参加ください。

原文を表示

The AI era is driving a new class of infrastructure: AI factories that transform data into intelligence for autonomous AI agents operating at unprecedented scale. Powered by accelerated computing, AI factories enable enterprises to train, fine-tune, and deploy AI with greater speed and efficiency.

This new class of infrastructure also introduces a fundamentally new attack surface spanning infrastructure, software supply chains, models, data, and autonomous agents with increasing authority to act. As agentic AI adoption accelerates, adversaries are increasingly targeting both AI infrastructure and the applications it powers, creating new risks to the confidentiality, integrity, and availability of mission-critical systems.

Traditional security architectures were not designed for the scale, complexity, and performance demands of AI factories. Securing this new infrastructure requires security that is distributed, full-stack, and accelerated.

This post explains how NVIDIA BlueField data processing units (DPUs) and NVIDIA DOCA secure AI factories through runtime detection, data access control, and accelerated network enforcement to protect AI infrastructure, workloads, agents, and data at AI scale.

How does in-silicon security change the traditional security model?

Purpose-built for AI infrastructure, NVIDIA BlueField DPUs combine high-performance networking, programmable compute, hardware acceleration, and advanced security capabilities into a single platform embedded into every AI factory compute node. Unlike traditional security approaches that rely on host system software, BlueField establishes a hardware-enforced, in-silicon, and workload-independent security layer.

Operating within its own trusted execution domain, BlueField isolates infrastructure and security services from the host system. Monitoring, policy enforcement, and telemetry operate even if the host or workloads become compromised. Because security functions remain isolated from the system they protect, attackers cannot tamper with or bypass BlueField-enforced infrastructure security policies.

This architecture fundamentally changes the traditional security model. Conventional endpoint protection shares the same trust boundaries and system resources as the environments it secures, making security software vulnerable to tampering, evasion, or disablement when a host is compromised. By offloading security processing to the BlueField silicon, it delivers resilient, full-stack protection without consuming host computing resources or competing with AI workloads—preserving peak infrastructure efficiency and AI performance.

Figure 1. NVIDIA BlueField-4 DPU delivers in-silicon security operating at the speed of AI agents
Figure 1. NVIDIA BlueField-4 DPU delivers in-silicon security operating at the speed of AI agents

How NVIDIA BlueField and DOCA protect the entire AI factory

With the NVIDIA Vera Rubin platform, security becomes distributed across the entire AI factory and built directly into the infrastructure layer. NVIDIA BlueField-4 processors are embedded in every compute and storage system—including NVIDIA Vera Rubin NVL72 compute trays, Vera CPU compute trays, LPX systems, and Vera BlueField-4 STX storage systems. This establishes a consistent, hardware-enforced security foundation across the platform.

Built on BlueField-4 silicon, a new class of NVIDIA DOCA security capabilities extends protection across the full AI lifecycle and the Vera Rubin platform. Whether safeguarding AI models, context memory, datasets, or runtime interactions, BlueField secures any data type, any workload, and any agent. This includes protecting autonomous agents themselves—and defending the AI factory from increasingly privileged agents operating across inference, training, and emerging agentic AI workflows.

The NVIDIA DOCA security stack provides a unified framework for protecting the entire AI factory. Leveraging BlueField-4 acceleration, DOCA enables runtime threat detection up to 1,000x faster than software-only agentless approaches, while enforcing network and file access policies at speeds up to 800 Gb/s. This enables security to operate at AI speed and scale.

Figure 2. NVIDIA end-to-end AI and security architecture extends across the agentic AI factory
Figure 2. NVIDIA end-to-end AI and security architecture extends across the agentic AI factory

The DOCA security stack includes DOCA Argus, DOCA Vault, and DOCA Flow which provide specialized capabilities spanning runtime threat detection, zero-trust access for file-based storage, and high-speed policy network enforcement. Together, these frameworks establish a robust security architecture for protecting AI infrastructure, workloads, agents, and data across the AI factory.

Integrated with NVIDIA AI, BlueField streams telemetry and security data to GPU-accelerated systems for AI-powered analysis, generating actionable security intelligence that can dynamically adapt protections and enforce policies directly on the DPU. The result is a continuously learning security architecture built for the speed, scale, and complexity of agentic AI.

How does DOCA Argus detect threats in AI workloads?

DOCA Argus is the runtime threat detection microservice that provides real-time visibility and situational awareness across the AI factory. Argus is the foundation of the DOCA security stack.

Running on BlueField data and storage processors, DOCA Argus continuously observes workload behavior at runtime using advanced memory analysis, enabling organizations to detect threats, monitor integrity, and understand operational state without impacting AI workload performance.

Unlike traditional host-based security approaches, DOCA Argus operates independently from the compute node it protects. By leveraging the BlueField hardware-isolated and attestable execution environment and DOCA direct memory access capabilities, Argus securely accesses specific snippets of volatile host memory—the authoritative source of truth for system activity—without relying on software agents or consuming host CPU resources. Through zero-copy memory access techniques, this inspection occurs without disrupting application or AI performance.

DOCA Argus automatically identifies the Linux kernel version running on the host system and applies kernel-specific memory maps to locate the precise memory structures required for analysis. Supporting both x86 and Arm64 architectures, the platform collects low-level telemetry directly from host memory structures and translates raw memory data into meaningful operational context, including visibility into processes, threads, execution states, workload activity, and system behavior.

A policy engine continuously analyzes collected telemetry to identify meaningful operational and security signals while filtering irrelevant activity. This enables real-time visibility into system behavior, indicators of attack, and anomalous runtime conditions. Security findings are categorized into events, which provide operational awareness and contextual visibility, and alerts, which indicate immediate threats or suspicious behavior requiring investigation or response.

By continuously analyzing memory for state changes and behavioral anomalies, DOCA Argus provides persistent runtime monitoring without relying on traditional host-based agents. Because security controls operate independently from the host, detection capabilities remain intact even if workloads or the operating system become compromised. At the same time, the continued collection of forensics evidence enables investigation of potential incidents and supports post-incident analysis.

Figure 3. DOCA Argus monitors AI threat detection
Figure 3. DOCA Argus monitors AI threat detection

Runtime integrity monitoring for AI

AI applications are commonly deployed as containers, where workloads instantiated from the same image are expected to exhibit consistent and predictable behavior. DOCA Argus leverages this consistency to establish behavioral profiles for AI workloads, enabling real-time monitoring for deviations that may indicate compromise, unauthorized activity, or malicious behavior.

DOCA Argus continuously validates runtime integrity by monitoring what is executing, how it is executing, and what it’s interacting with at runtime. This includes comparing the behavior and properties of binaries against expected runtime manifests, validating integrity through SHA-256 hashes, analyzing execution context such as command-line arguments and execution paths, and monitoring interactions with threads, libraries, the file system, network, and memory to verify workloads are operating as intended.

The platform provides process-level visibility into file access and network activity, continuously monitoring which files are accessed, by which processes, and what actions are performed. Inbound and outbound network connections are analyzed to ensure workloads maintain expected communication patterns and do not exhibit suspicious behavior.

By comparing live runtime activity against established behavioral baselines, DOCA Argus can identify integrity violations and indicators of compromise in real time. Detection capabilities include, for example, unauthorized process execution, unauthorized library usage, drift detection, bash shell execution, reverse shell activity, and other runtime anomalies associated with compromise or malicious behavior.

AI discovery and exposure management

DOCA Argus also provides a foundational visibility layer for AI discovery and exposure management across the AI factory. The platform continuously identifies, maps, and contextualizes AI infrastructure, workloads, and their relationships in real time.

This includes workload posture awareness across containers (including Kata containers), virtual machines, and bare-metal systems, as well as mapping relationships between infrastructure components such as container-to-POD, container-to-VM, and container-to-operating-system dependencies.

Using container image hashes, DOCA Argus can help identify deployed AI software, models, and autonomous agents by correlating runtime artifacts against publicly available repositories and internal enterprise software inventories. Leveraging DOCA Argus telemetry, organizations gain visibility into which AI components are running, where they are deployed, and how they interact across the environment.

DOCA Argus can also support passive vulnerability management by analyzing the SHA-256 hashes of executed binaries and loaded libraries to help identify potentially vulnerable software components.

Integration of AI processing into cybersecurity operations

DOCA Argus integrates seamlessly with existing cybersecurity ecosystems through standard telemetry export mechanisms, including Fluent Bit and Vector, enabling organizations to stream security telemetry into SIEM, SOAR, XDR platforms, and enterprise data lakes for enrichment and analysis.

Cybersecurity teams can extend existing analytics, correlation engines, threat intelligence, and automated incident response workflows into AI environments seamlessly, without requiring major architectural changes. Cybersecurity providers can ingest and normalize DOCA Argus telemetry alongside data from their own sensors, enabling AI workloads and accelerated infrastructure to be monitored through the same operational lens as traditional environments for threat detection and investigation.

Importantly, DOCA Argus preserves privacy by restricting extracted telemetry to operational and security-relevant information without exposing personally identifiable information (PII).

Running on a single BlueField processor, DOCA Argus can provide comprehensive runtime monitoring and threat detection for an entire compute node, delivering infrastructure-level visibility and protection with minimal operational overhead. Combined with BlueField in-silicon security architecture, DOCA Argus enables enterprises and cloud AI factory builders to secure any workload at scale without sacrificing performance, efficiency, or AI throughput.

How does DOCA Vault enable real-time data access control?

DOCA Vault is a data security framework purpose-built for file-based, AI-native storage, enabling real-time control over how data is accessed across the AI factory. DOCA Vault enforces granular authorization policies directly in silicon, independent of the host operating system and storage platform.

This enables a zero-trust access layer for file-based storage, ensuring that only authorized AI workload processes—including agents, training jobs, inference services, and AI applications—can access the specific data required for operation and only with explicitly permitted actions.

Unlike traditional access controls that rely on the host system for enforcement, DOCA Vault operates inline with storage access requests, maintaining policy enforcement even if the host operating system, applications, or storage layer become compromised. This architecture enables enterprises to securely scale multi-agent AI environments while preserving consistent security controls across heterogeneous storage infrastructure.

DOCA Vault is integrated with DOCA Argus and DOCA SNAP (through the DOCA Device Emulation SDK), to provide the visibility and enforcement required for secure, policy-driven storage access. DOCA SNAP presents networked storage as local file system devices to the host system by emulating local drives on the PCIe bus. As a result, operating systems and hypervisors continue using standard storage drivers without awareness that requests are being transparently redirected through a BlueField-accelerated storage framework.

This architecture allows file access requests to be intercepted and evaluated before data access occurs. DOCA Vault enriches storage requests with contextual telemetry gathered from DOCA Argus, creating a detailed understanding of the process initiating the request, the targeted file, and the requested action, such as OPEN, READ, or WRITE. These contextual signals allow DOCA Vault to enforce highly granular authorization policies that ensure only the right workload processes access the right files with the appropriate permissions.

Figure 4. The DOCA Vault data security framework is purpose-built for file-based, AI-native storage
Figure 4. The DOCA Vault data security framework is purpose-built for file-based, AI-native storage

DOCA Vault also extends protection beyond traditional authorization by enforcing runtime integrity controls for AI workloads and storage environments. Fine-grained policies can restrict which programs are allowed to execute, prevent unauthorized file creation, limit runtime drift, and block unauthorized model or data exfiltration. By tightly governing file access behavior, Vault significantly reduces the actions an attacker can perform after gaining initial access to a workload or container.

In multiagent AI systems, where agents increasingly access shared datasets, memory, and models autonomously, this level of control becomes especially important. Unauthorized or unexpected file activity is blocked in real time and can serve as a strong indicator of compromise, helping organizations detect malicious behavior before it propagates across the AI factory.

DOCA Vault embeds storage security directly into the infrastructure layer, enabling enterprises to protect sensitive datasets, AI models, context memory, and intellectual property without sacrificing performance. Running inline on BlueField-4, Vault delivers real-time authorization and protection while preserving maximum AI throughput and application efficiency.

How does DOCA Flow accelerate advanced security services?

DOCA Flow is a foundational library within the DOCA software platform that enables developers and cybersecurity providers to create high-performance, hardware-accelerated packet processing pipelines on BlueField processors. Through a programmable API, developers can define packet processing “pipes” that execute directly in networking hardware, offloading networking and security operations from the host CPU while maintaining ultra-low latency and high throughput.

By executing packet inspection, encryption, filtering, and policy enforcement directly in silicon, DOCA Flow enables network security to operate at AI speed and scale without impacting application or AI workload performance.

One of the core uses of DOCA Flow is programming BlueField processors to function as high-performance Layer 4 firewalls with built-in connection tracking, enabling granular control over front-end and back-end traffic across the AI factory. This enables organizations to enforce network segmentation, isolate workloads, and prevent unauthorized communication paths in real time—including for encrypted traffic.

DOCA Flow enables cybersecurity providers to accelerate advanced security services directly on BlueField. This includes Layer 7 firewalls, AI security gateways, application-aware inspection, and policy enforcement services purpose-built for accelerated infrastructure and agentic AI environments.

As AI factories scale to support increasingly distributed and autonomous workloads, network communication becomes a critical attack surface. DOCA Flow enables security policies to be enforced directly within the infrastructure layer, preventing threats from propagating laterally across systems while maintaining the line-speed performance and the efficiency required for large-scale AI training and inference.

Get started with NVIDIA DOCA for agentic AI factory security

While each component of the NVIDIA DOCA security stack delivers powerful security capabilities independently, together DOCA Argus, DOCA Vault, and DOCA Flow establish a unified, in-silicon security framework for protecting the entire AI factory and agentic AI lifecycle. Combining runtime visibility, zero-trust data protection, and accelerated network enforcement, the stack enables end-to-end security for AI infrastructure, workloads, agents, and data without compromising performance or scalability.

Built to operate together on NVIDIA BlueField processors, these interoperable services share telemetry, policy context, and enforcement capabilities to provide coordinated protection across infrastructure, workloads, data, and network communications.

The result is a secure-by-design architecture for agentic AI: one that continuously verifies trust, enforces policy at infrastructure speed, and protects AI factories at the scale and performance demanded by modern accelerated computing. To learn more, see Build Secure AI Infrastructure with DOCA and dive deeper into NVIDIA DOCA and accelerated infrastructure.

Join NVIDIA founder and CEO Jensen Huang for the NVIDIA GTC Taipei 2026 Keynote to learn more about the future of AI infrastructure.

この記事をシェア

関連記事

Vercel Blog★42026年6月18日 01:00

Vercel Ship 2026 レポート:エージェント向けインフラの未来を語る

Vercel は、思考するソフトウェアを含むあらゆるものをデプロイできるフルスタックプラットフォームとして、エージェント向けのインフラ構築ビジョンを発表し、ロンドンで約 2,500 人が参加したイベントを開催しました。

AWS Machine Learning Blog★42026年6月19日 23:05

Adobe Marketing Agent for Amazon Quick によるキャンペーンワークフローの加速

AWS と Adobe は、Amazon Quick と Adobe Marketing Agent を連携させることで、マーケティングチームが自然言語で質問するだけで、ガバナンスされた会話環境内で数秒以内にキャンペーンのパフォーマンスやオーディエンスに関するインサイトにアクセスできるようにした。

AI News★42026年6月19日 23:02

SAP と Google Cloud がエージェント型コマースアーキテクチャを展開

SAP と Google Cloud は、企業規模でのマルチエージェントマーケティングおよび小売業務の自動化を目的として、エージェント型コマースアーキテクチャの展開を開始した。両社は顧客データの共有不足という構造的課題への対応を掲げている。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む