NVIDIA Quantum InfiniBand でワンクリックのマルチテナントセキュリティを実現
NVIDIA は Quantum InfiniBand の Unified Fabric Manager に意図ベースのセキュリティプロファイルを追加し、手動設定を不要にして大規模 GPU クラスターでのテナント分離を数分で実現可能にした。
キーポイント
ワンクリックで多テナントセキュリティを実現
Unified Fabric Manager (UFM) に「General」「Bare Metal Cloud」「Secured Bare Metal Cloud」の 3 つのプロファイルが追加され、数クリックで堅牢な分離設定が可能になった。
ハードウェアベースの包括的な保護機能
Partition Key (PKey) の隔離、MAD キー保護、GUID ベースのアクセス制御、継続的検証など、インフラ全体にわたるセキュリティ機能が自動適用される。
従来のネットワーク設定課題の解決
エンドポイントが自律的に判断する従来型ネットワークと異なり、中央集権管理により設定ミスを防ぎ、大規模環境でも一貫したポリシーを強制できる。
意図ベースセキュリティプロファイルの導入
複雑な手動設定に代わり、事前定義されたプロファイルを選択するだけで UFM が自動的にすべてのセキュリティ設定をオーケストレーションし、構成ミスを防ぎます。
多テナント環境向けの専用プロファイル
単一テナント用「General」に加え、マルチテナントクラウド向け「Bare Metal Cloud」と高セキュリティ要件向け「Secured Bare Metal Cloud」の 2 つのプロファイルが用意されています。
スケーラビリティと効率性の向上
数百ノードの追加でも管理オーバーヘッドが増加しないゼロタッチスケーリングが可能となり、設定からデプロイまでの時間を数時間・数日から数分に短縮できます。
ハードウェアベースのテナント分離
PKey(Partition Key)によるインフィニバンドパーティショニングは、ハードウェアメカニズムでテナント間のネットワークアクセスを物理的に遮断し、ホスト側のソフトウェアや特権を持つテナントによる迂回を防ぎます。
影響分析・編集コメントを表示
影響分析
この発表は、大規模 AI クラスターの運用においてセキュリティ設定がボトルネックとなっていた課題を解決する重要な進展です。特にアジェンティック AI や HPC 環境で急増する GPU 接続数に対応するため、人間の手を介さない自動かつ堅牢な分離メカニズムを提供することで、クラウドプロバイダーの信頼性とスケーラビリティを大幅に向上させるでしょう。
編集コメント
大規模 AI クラスター運用におけるセキュリティ設定の「属人性」を排除し、ハードウェアレベルで保証された分離を実現する点は、信頼性の高い AI インフラ構築において極めて重要です。
NVIDIA Quantum InfiniBand は、Unified Fabric Manager (UFM) において意図ベースのセキュリティプロファイルを提供し、ワンクリックでマルチテナントファブリックセキュリティを実現します。
NVIDIA Quantum InfiniBand は 3 つのプロファイルをサポートしています:General(一般)、Bare Metal Cloud(ベアメタルクラウド)、Secured Bare Metal Cloud(セキュア化されたベアメタルクラウド)。ネットワーク管理者は now 自動的に以下を構成できるようになりました:
- Partition Key (PKey) 分離
- Management Datagram (MAD) キー保護
- Global Unique Identifier (GUID) ベースのアクセス制御
- 継続的な検証
これにより、デプロイ時間が数時間または数日から数分に短縮され、クラウドプロバイダーは手動の Subnet Manager (SM) 設定なしで、数万台の GPU にわたるハードウェア強制型のテナント分離を実行できるようになります。
AI、HPC(高性能計算)、およびハイパースケールクラウドコンピューティングの指数関数的な成長に伴い、ネットワークファブリックの完全性はかつてないほど重要になっていますが、多くのネットワークではセキュリティは後回しにされがちです。
InfiniBand はこれとは対照的なアプローチを採用しています:セキュリティはファブリックのすべてのレイヤーにわたって拡張されます。InfiniBand が最もよく知られているのは超低遅延、高スループット、そして大規模なスケーラビリティですが、その 多層化されたセキュリティアーキテクチャ も同様に堅牢です。
本記事では、意図ベースのプロファイルがどのようにしてデプロイを容易にするかを解説します。
従来のネットワークがマルチテナントセキュリティでなぜ不足するのか
InfiniBand は、ソフトウェア定義型かつ中央集権的に管理されるファブリックです。従来のネットワークでは、エンドポイントが独立して動作し、独自のルーティング、リソース、ポリシー決定を行うことが多くあります。この中央集権的な監視の欠如は、設定ミスや一貫性のないポリシー、セキュリティ上の脆弱性を招く可能性があります。NVIDIA Quantum InfiniBand は、UFM(Unified Fabric Manager)に制御を集中させることでこれを回避し、グローバルポリシーの適用、経路の最適化、ヘルスモニタリング、ファブリックの積極的な保護を実現します。
NVIDIA が完全性メカニズムやハードウェアベースのテナント分離といった堅牢なソリューションを提供しているにもかかわらず、Quantum InfiniBand はイーサネットほど広く理解されていないため、これらの機能は依然として十分に活用されていません。
現在、InfiniBand の高度なセキュリティ機能と、深い専門知識なしにユーザーが容易にそれらを実装する能力との間のギャップを埋めることが緊急の課題となっています。数万台の GPU と数千台のスィッチを接続するエージェント AI 環境において、テナント分離におけるわずかな設定ミスでも、機密性の高い独自データが漏洩したり、大規模な分散ワークロードが停止したりする可能性があります。セキュリティ機能はスケーラブルであり、かつ容易にデプロイ可能である必要があります。これにより、顧客の作業負担を軽減し、クラスターをより安全なものにするのです。
これらの課題に対処するため、NVIDIA は InfiniBand のセキュリティ機能を有効化するためのワンクリックソリューションを提供します。
NVIDIA Quantum InfiniBand における意図ベースのセキュリティプロファイルとは?
NVIDIA は、異なるデプロイメントモデル全体にわたるセキュリティ設定を簡素化し標準化するために、意図ベースのセキュリティプロファイルを導入しています。複数のパラメータを手動で設定する代わりに、ユーザーは事前定義されたプロファイルを選択するだけでよく、UFM が自動的にすべての基盤となるセキュリティ設定をオーケストレーションします。
意図ベースのプロファイルの主な利点は以下の通りです:
- エラーの削減:プロファイルは NVIDIA のエンジニアリングが意図した通りにセキュリティ機能を実装・展開するため、誤解やドキュメント不足によるミスを防ぎます。
- 設定時間の短縮:手動で多段階の UFM/SM 設定から、事前設定された意図ベースのプロファイルへ移行することで、学習、設定の適応、デプロイおよびテストにかかる時間を数時間または数日から数分に削減できます。
- ゼロタッチスケーリング:マルチテナント環境に数百ノードを追加しても、セキュリティ管理のオーバーヘッドが線形に増加することはありません。
- セキュリティダウンタイムなし:新しいセキュリティ機能が追加される場合、それは関連するプロファイル設定に直接組み込まれるため、新機能のリリースとデプロイでの有効化の間に移行フェーズが存在しません。
General プロファイルは、基本的な出荷時構成を備えたシングルテナント環境向けに設計されています。
Bare Metal Cloud はマルチテナントクラウド環境向けに最適化されており、Secured Bare Metal Cloud は高度にセキュリティが強化されたマルチテナント環境向けのハードニング済みプロファイルです。
以下のセクションでは、Bare Metal Cloud および Secured Bare Metal Cloud のプロファイルタイプについてより詳細に説明します。
The Bare Metal Cloud profile
Bare Metal Cloud プロファイルは、PKey ベースの分離を可能にし、InfiniBand 管理ネットワーク上でクラウド環境内におけるテナントの分離を提供します。
イーサネット VLAN に類似して、PKey を用いた InfiniBand のパーティショニングは、どのノードやポートがネットワークリソースにアクセスできるかを定義し、ハードウェアメカニズムを用いてあるパーティション内のポートが別のパーティションにアクセスできないように防止します。
このメカニズムが多テナント展開に特に適している理由は、パーティションの割り当てが SM (Subnet Manager) によって完全に制御される点にあります。ノードは自分自身のパーティションを決定できず、アプリケーションも使用するパーティションを指定することはできません。彼らができるのは、すでにポートに割り当てられたパーティションを参照することだけです。
ポート属性はハードウェア内に保存され、SM と InfiniBand シリコンのみが知る管理キー (MKey) を介してのみアクセス可能です。このアーキテクチャにより、クラウドサービスプロバイダーやデータセンター運営者は強力な分離保証を得ることができます。同じ物理的な InfiniBand ファブリックを共有するテナントは、ハードウェアレベルで暗号的かつ論理的に分離されており、特権を持つテナントが回避可能なホスト側のソフトウェアによる強制に依存していません。
セキュア・ベアメタルクラウドプロファイル
セキュア・ベアメタルクラウドプロファイルは、PKey 分離を基盤とし、安全なマルチテナントクラウド環境に必要な包括的なセキュリティ機能セットを実現します:
- ランダム化されたシードを含む完全な MAD キー保護。これには MKEY, VSKEY, PMKEY, CCKEY, Class C キー (N2N), AM およびジョブキー、SMKEY, SAKEY が含まれます。
- 許可済み GUID リスト機能を使用した GUID ベースのアクセス制御。
- service_key を介したサービスレベル認証(例:AM サービス用)
- すべてのコマンドに適用される強化された SA 信頼モデル
- 濫用や輻輳から保護するための MAD レート制限 (MAD Limiter)
DoS/DDoS 保護: 管理ノードを保護するため、個々のノードからの過剰なパケットレートを自動的に検出し制限します。
- ソースベースレート制限: 各ノードのソース LID アドレスに基づいてトラフィックを監視・制御して動作します。
このアプローチにより複雑性が削減され、設定エラーが最小化され、デプロイメント全体で一貫したセキュリティ強制が可能となり、ユーザーはインフラストラクチャの挙動を意図する運用モデルに整合させることができます。
CSV を用いた NVIDIA Quantum InfiniBand セキュリティ姿勢の検証方法
NVIDIA Quantum InfiniBand デプロイメントでサポートされているもう一つの機能として、継続的セキュリティ検証 (CSV) があります。これは静的解析とログベース監査を実行する新しい UFM 診断機能であり、検出された脆弱性に対してユーザーに「セキュリティヘルススコア」と具体的な自動修復手順を提供します。
意図ベースのプロファイルと組み合わせることで、この予防診断ツールは、効率的かつ安全なネットワーク運用を確保する上で極めて重要です。
以下の図 1 に示すスクリーンショットでは、セキュリティレポートの生成フローが示されています。
システムヘルスタブにおいて、ユーザーは上部メニューから「Security」を選択します。
image*図 1: UFM Cyber AI のシステムヘルスセキュリティダッシュボードを使用して、ネットワークのセキュリティ姿勢を検証できます*
次に、ユーザーは必要な詳細度レベル(エラーのみ、エラーと警告、情報)を選択し、PKeys 設定のテストオプションを指定した上でレポートを実行します。以下の図 2 を参照してください。
image*図 2: セキュリティ検証レポートは、選択された詳細度レベルに基づいて異なる出力を表示します*
レポートが完了すると、結果には選択した詳細度レベルに基づいたエラー、警告、および情報メッセージのリストが表示されます。以下の図 3 を参照してください。
image*図 3: システムヘルスセキュリティレポートは、潜在的なネットワークセキュリティ脆弱性のリストを表示します*
さらに詳しく知る
複雑なファブリックセキュリティ機能を運用可能なデプロイメントに落とし込むためのガイドラインとベストプラクティスについては、NVIDIA Quantum InfiniBand セキュリティホワイトペーパーをお読みください。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
原文を表示
NVIDIA Quantum InfiniBand now offers intent-based security profiles in Unified Fabric Manager (UFM) that enable multi-tenant fabric security in a single click.
NVIDIA Quantum InfiniBand supports three profiles: General, Bare Metal Cloud, and Secured Bare Metal Cloud. Network administrators can now auto-configure:
- Partition Key (PKey) isolation
- Management Datagram (MAD) key protection
- Global Unique Identifier (GUID)-based access control
- Continuous validation
This cuts deployment time to minutes from hours or days, letting cloud providers run hardware-enforced tenant isolation across tens of thousands of GPUs without manual Subnet Manager (SM) configuration.
With the exponential growth of AI, HPC, and hyperscale cloud computing, the integrity of the network fabric is more critical than ever, yet many networks treat security as an afterthought.
InfiniBand takes the opposite approach: security extends across every layer of the fabric. While InfiniBand is best known for ultra-low latency, high throughput, and massive scalability, its multilayered security architecture is equally robust.
This post explains how intent-based profiles make it easy to deploy.
Why traditional networks fall short on multi-tenant security
InfiniBand is a software-defined, centrally managed fabric. In traditional networking, endpoints often operate independently, making their own routing, resource, and policy decisions. This lack of centralized oversight can lead to misconfigurations, inconsistent policies, and security vulnerabilities. NVIDIA Quantum InfiniBand avoids this by centralizing control in UFM, which enforces global policies, optimizes routes, monitors health, and proactively secures the fabric.
Despite NVIDIA providing robust solutions such as integrity mechanisms and hardware-enforced tenant isolation, such features remain underutilized because Quantum InfiniBand isn’t as widely understood as Ethernet.
There is currently a critical need to bridge the gap between InfiniBand’s advanced security capabilities and the user’s ability to easily implement them without deep domain expertise. In agentic AI environments that are connecting tens of thousands of GPUs with thousands of switches, even a minor configuration error in tenant isolation can compromise sensitive proprietary data or disrupt massive distributed workloads. Security features must be scalable and easy to deploy to make customers’ work easier and their clusters more secure.
To address these issues, NVIDIA presents a one-click solution for enabling InfiniBand security features.
What are intent-based security profiles for NVIDIA Quantum InfiniBand?
NVIDIA is introducing intent-based security profiles to simplify and standardize security configuration across different deployment models. Instead of manually configuring multiple parameters, users can select a predefined profile, and UFM will automatically orchestrate all underlying security settings.
The following are key benefits of intent-based profiles:
- Fewer errors: Profiles implement and deploy security features as NVIDIA engineering intends, protecting against misunderstandings or missing documentation.
- Configuration time reduction: Transitioning from manual, multi-step UFM/SM configurations to pre-configured, intent-based profiles can reduce learning, adapting configurations, and deployment and testing time to minutes from hours or days.
- Zero-touch scaling: Hundreds of nodes can be added to a multi-tenant environment without a linear increase in security management overhead.
- No security downtime: When a new security feature is added, it is added to the relevant profile configurations, removing the transition phase between releasing a new feature and enabling it in deployment.
The General profile is designed for single-tenant environments with a basic out-of-the-box configuration.
Bare Metal Cloud is tailored for multi-tenant cloud environments and Secured Bare Metal Cloud is a hardened profile for highly secure multi-tenant environments.
The following sections will go into more detail about the Bare Metal Cloud and Secured Bare Metal Cloud profile types.
The Bare Metal Cloud profile
The Bare Metal Cloud profile enables PKey-based isolation, providing tenant separation within cloud environments over the InfiniBand management network.
Analogous to Ethernet VLANs, InfiniBand partitioning with PKeys defines which nodes or ports can access network resources, using hardware mechanisms to prevent ports in one partition from accessing another.
What makes this mechanism particularly well-suited to multi-tenant deployments is that partition assignment is controlled entirely by the SM: Nodes can’t determine their own partitions, and applications can’t specify which partition to use; they can only reference partitions already assigned to their port.
Port attributes are stored in hardware and are accessible only via the Management Key (MKey), which is known exclusively to the SM and the InfiniBand silicon. This architecture gives cloud service providers and data center operators a strong isolation guarantee. Tenants sharing the same physical InfiniBand fabric are cryptographically and logically separated at the hardware level, with no reliance on host-side software enforcement that a tenant with elevated privileges could circumvent.
The Secured Bare Metal Cloud profile
The Secured Bare Metal Cloud profile builds on PKey isolation and enables a comprehensive set of security features required for secure multi-tenant cloud environments:
- Full MAD key protection with randomized seeds, including: MKEY, VSKEY, PMKEY, CCKEY, Class C key (N2N), AM and job keys, SMKEY, and SAKEY
- GUID-based access control using the allowed_guid_list feature
- Service-level authentication via service_key (e.g., for AM services)
- Enhanced SA trust model applied to all commands
- MAD rate limiting (MAD Limiter) to protect against abuse and congestion
DoS/DDoS Protection: Automatically identifies and limits excessive packet rates from individual nodes to protect the management node.
- Source-Based Rate Limiting: Operates by monitoring and controlling traffic based on the source LID address of each node.
This approach reduces complexity, minimizes configuration errors, and ensures consistent security enforcement across deployments, allowing users to align infrastructure behavior with their intended operational model.
How to validate NVIDIA Quantum InfiniBand security posture with CSV
Another feature supported for NVIDIA Quantum InfiniBand deployments is Continuous Security Verification (CSV). This is a new UFM diagnostic capability that performs static analysis and log-based auditing. It provides users with a “Security Health Score” as well as specific, automated remediation steps for any detected vulnerabilities.
Combined with intent-based profiles, this proactive diagnostic tool is critical for ensuring efficient and secure network operations.
In Figure 1, below, the screenshots show the flow for generating the security report.
In the System Health tab, users select Security from the top menu.

Next, users select the desired verbosity level (Errors, Errors and Warnings, and Info), as well as the option to test PKeys settings, and then run the report. See Figure 2, below:

Once the report is completed, the results will display a list of errors, warnings, and information messages based on the selected verbosity level. See Figure 3, below:

Going further
For more information about guidelines and best practices for translating complex fabric security features into actionable deployment, learn more by reading the NVIDIA Quantum InfiniBand security white paper.
関連記事
中国系影響力操作が米国の AI 議論を標的にしている
OpenAI は、中国に関連する勢力がアメリカ国内の人工知能に関する議論に介入し、影響力を行使しようとしていると警告した。
データセンターへのドローン攻撃が大手テック企業を震撼、中東プロジェクト停止へ
イランによるミサイルまたはドローン攻撃で施設が損傷したことを受け、ロンドン拠点の純粋データセンターグループ(Pure Data Centre Group)が中東での全投資を一時停止した。これにより、シリコンバレーの投資家やテック企業が中東に AI やクラウド用データセンターを建設する兆候ある計画の見直しが迫られている。
イラン、『スターゲート』AIデータセンターを標的にすると脅威
イラン政府は、米国との戦争が激化する中、米国関連のデータセンターを新たなミサイル攻撃で標的にすると発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み