AWSとNVIDIA、AIのパイロットから本番環境への移行を加速する戦略的連携を深化
AWSとNVIDIAは2026年から100万以上のNVIDIA GPUをAWSリージョンに展開し、Blackwellアーキテクチャ対応インスタンスやNVIDIA NIXLによるインターコネクト高速化など、AIの本番運用を加速するための戦略的連携を拡大した。
キーポイント
大規模GPUインフラの拡張
AWSは2026年から100万以上のNVIDIA GPU(BlackwellおよびRubinアーキテクチャを含む)をグローバルリージョンに展開し、AI/MLワークロードの多様なニーズに対応する。
新GPUアーキテクチャの先行対応
Amazon EC2がNVIDIA RTX PRO 4500 Blackwell Server Edition GPUを主要クラウドプロバイダーで初めてサポートし、高性能コンピューティングを提供する。
インターコネクト技術の高速化
NVIDIA NIXLをAWS Elastic Fabric Adapter(EFA)で活用し、分散型LLM推論のためのインターコネクトを高速化する。
パフォーマンスの大幅向上
Amazon EMR on Amazon EKSとAmazon EC2 G7eインスタンス(NVIDIA RTX PRO 6000 Blackwell搭載)により、Apache Sparkのパフォーマンスを3倍向上させる。
モデルサポートの拡大
Amazon BedrockでのNVIDIA Nemotronモデルサポートを拡大し、基盤モデルのアクセス性を高める。
影響分析・編集コメントを表示
影響分析
この連携はクラウドAIインフラの競争力を大きく左右するもので、大規模なGPUリソースの確保と最新アーキテクチャの早期導入により、AWSの市場優位性を強化する。特に企業のAI本番導入を支える基盤として、業界全体のAI実用化を後押しする重要な動きである。
編集コメント
クラウドAIインフラ競争の重要な節目となる発表。100万GPUという規模感とBlackwellの先行導入は、AWSの市場戦略の明確な優位性を示している。

AI は急速に進化しており、多くの顧客にとって真の機会とは実験を行うことではなく、意味のあるビジネス成果をもたらすために本番環境で AI を運用することにあります。つまり、信頼性が高く、スケールに対応し、組織のセキュリティおよびコンプライアンス要件を満たすシステムを構築する必要があります。
本日開催された NVIDIA GTC 2026 で、AWS と NVIDIA は、増大する AI コンピューティング需要への対応と、本番環境で運用可能な AI ソリューションの構築・実行支援を目的とした、新たな技術統合を含む協力の拡大を発表しました。これらの統合は、アクセラレーテッドコンピューティング(加速計算)、相互接続技術、およびモデルのファインチューニング(微調整)や推論にまたがっています。具体的には以下の通りです:
- 2026 年から AWS リージョン全体で 100 万枚以上の NVIDIA GPU の展開
- Amazon Elastic Compute Cloud (Amazon EC2) における NVIDIA RTX PRO 4500 Blackwell Server Edition GPU のサポート(主要クラウドプロバイダー初の対応)
- AWS Elastic Fabric Adapter (EFA) 上で NVIDIA NIXL を活用した、分散型大規模言語モデル(LLM)推論のための相互接続アクセラレーション
- Amazon EC2 G7e インスタンスと NVIDIA RTX PRO 6000 Blackwell Server Edition GPU を搭載した Amazon EMR on Amazon Elastic Kubernetes Service (Amazon EKS) を用いた、Apache Spark のパフォーマンスが 3 倍向上
- Amazon Bedrock における NVIDIA Nemotron モデルサポートの拡大
NVIDIA GTC 2026 における主要発表
GPU オプションの拡大と最適化された相互接続による AI インフラのスケーリング
エージェント型 AI 時代における計算能力の加速
2026 年から、AWS はグローバルクラウドリージョン全体で、Blackwell および Rubin GPU アーキテクチャを含む 100 万個以上の NVIDIA GPU を追加します。AWS は、多様な AI/ML ワークロードを駆動するために、どのクラウドプロバイダーよりも広範な NVIDIA GPU ベースのインスタンスコレクションを提供しています。また、AWS と NVIDIA は Spectrum ネットワーキングやその他のインフラ分野でも協力しており、両社間の 15 年以上にわたる共同イノベーションにさらに貢献していきます。
AWS の高度なクラウドおよび AI インフラは、複雑なワークフロー全体で推論、計画、自律的な行動が可能なエージェント型 AI システムを構築・拡張するために必要なインフラを、企業、スタートアップ、研究者に提供します。
NVIDIA RTX PRO 4500 Blackwell Server Edition GPU を搭載した新しい Amazon EC2 インスタンス
本日、NVIDIA RTX PRO 4500 Blackwell Server Edition GPU で加速された Amazon EC2 インスタンスがまもなく登場すると発表しました。AWS は、RTX PRO 4500 Blackwell Server Edition GPU のサポートを発表した主要クラウドプロバイダー初の企業です。これらのインスタンスは、データ分析、対話型 AI、コンテンツ生成、レコメンデーションシステム、ビデオストリーミング、ビデオレンダリング、その他のグラフィックスワークロードなど、幅広いワークロードに最適化されています。
NVIDIA RTX PRO 4500 Blackwell Server Edition GPU で加速された Amazon EC2 インスタンスは、AWS Nitro System を基盤に構築されます。これは専用ハードウェアと軽量ハイパーバイザーの組み合わせであり、ホストハードウェアの計算リソースとメモリリソースを実質的にすべてインスタンスに割り当てることで、全体的なリソース利用率とパフォーマンスを向上させます。Nitro System の専用ハードウェア、ソフトウェア、ファームウェアは、AWS 関係者を含むいかなる者も、機密性の高い AI ワークロードやデータにアクセスできないよう制限を課すために設計されています。さらに、Nitro System はシステムが稼働している間でも、ファームウェアの更新、バグ修正、最適化をサポートします。これらの Nitro System 内の機能により、本番環境で必要とされる AI、分析、グラフィックスワークロードに必要な、リソース効率の向上、セキュリティ、安定性が実現されます。
AWS EFA と Trainium を用いた NVIDIA NIXL による非集約型 LLM 推論の相互接続加速
モデルサイズが大きくなるにつれ、GPU 間や Trainium 間の通信オーバーヘッドがボトルネックとなる可能性があります。本日、Amazon EC2 上で NVIDIA GPU と AWS Trainium の両方に対応する非集約型大規模言語モデル(LLM)推論を加速するため、AWS EFA と連携した NVIDIA Inference Xfer Library (NIXL) のサポートを発表しました。現代の AI ワークロードのスケーリングにおいて非集約型推論の加速が重要な理由は、通信と計算の効率的な重なりを実現し、通信レイテンシを最小化しながら GPU 利用率を最大化できるからです。この統合により、トークン生成を行う GPU コンピューティングノードと KV キャッシュ状態を格納する分散メモリリソースの間で、高スループットかつ低レイテンシの KV キャッシュデータ転送が可能になります。また、GPU と Trainium の EFA 対応 EC2 インスタンスを任意に組み合わせて推論クラスターを構築するための柔軟性も提供します。NIXL は EFA とネイティブに統合され、NVIDIA Dynamo、vLLM、SGLang などの人気のあるオープンソースフレームワークと連携することで、トークン間のレイテンシの改善と KV キャッシュメモリのより効率的な利用を実現します。
Amazon EMR と NVIDIA GPU を活用したデータ分析の加速
Amazon EKS 上の Amazon EMR で G7e インスタンスを使用し、Apache Spark の実行速度を 3 倍に
データエンジニアとデータサイエンティストは、AI/ML モデルの反復やビジネスインテリジェンス生成を遅らせる数時間にわたるデータ処理パイプラインに頻繁に直面しています。これらのワークロードにおいて、AWS と NVIDIA は Amazon EMR on EKS を G7e インスタンス上で実行することで、Apache Spark ワークロードに対して 3 倍の高速化を実現し、顕著なパフォーマンス向上をもたらしています。この性能は、Amazon EMR on EKS と NVIDIA の RTX PRO 6000 アーキテクチャを組み合わせることで GPU アクセラレーションされた分析を最適化する、AWS と NVIDIA の共同エンジニアリング協力によるものです。Amazon EMR と G7e インスタンスを使用することで、データエンジニアとデータサイエンティストは、AI/ML 特徴量のエンジニアリング、複雑な ETL(Extract, Transform, Load)変換、および大規模なリアルタイム分析におけるインサイトまでの時間を短縮できます。大規模なデータ処理パイプラインを実行している顧客は、既存の Spark アプリケーションとの完全な互換性を維持しながら、分析実行に必要な時間を削減することができます。
Amazon Bedrock 上の NVIDIA Nemotron モデルサポートの拡大
強化学習ファインチューニング(Reinforcement Fine-Tuning)による Amazon Bedrock での Nemotron モデルのファインチューニング(近日公開予定)
開発者は間もなく、Reinforcement Fine-Tuning (RFT) を用いて NVIDIA Nemotron モデルを Amazon Bedrock 上で直接ファインチューニングできるようになります。これは、モデルの振る舞いを法務、医療、金融、あるいはその他の専門分野といった特定のドメインに適合させる必要があるチームにとって重要です。強化学習によるファインチューニングでは、モデルが何を知っているかだけでなく、どのように推論し、どう応答するかを形作ることができます。また、これが Amazon Bedrock 上でネイティブに実行されるため、インフラのオーバーヘッドはゼロです。タスクを定義し、フィードバック信号を提供するだけで、Bedrock が残りの処理を担当します。Amazon Bedrock における Reinforcement Fine-Tuning について詳しく学ぶことができます。
Nemotron 3 Super on Amazon Bedrock (Coming soon)
複雑なマルチステップワークフロー全体で AI エージェントの精度を維持できるように設計された、マルチエージェントワークロードと拡張推論に特化したハイブリッド MoE モデルである NVIDIA Nemotron 3 Super がまもなく Amazon Bedrock に登場します。これは金融、サイバーセキュリティ、小売、ソフトウェア開発など幅広いユースケースを可能にし、フルマネージド API を通じて高速かつコスト効率の高い推論を実現します。
エネルギー効率と持続可能性の向上
AI ワークロードがスケールするにつれ、ワットあたりのパフォーマンスは単なる持続可能性の指標ではなく、競争優位性そのものとなっています。この NVIDIA GTC セッション では、Amazon の最高戦略責任者(CSO)である Kara Hurst が、Equinix と PepsiCo のサステナビリティリーダーと共に参加し、AI がどのように大規模な企業のエネルギーとインフラを変革しているかについて議論します。具体的には、データセンターがアクティブなグリッドの参加者となること、AI が企業効率化エンジンとして機能すること、そして AWS インフラストラクチャがオンプレミス型データセンターと比較して 4.1 倍のエネルギー効率を達成できることを通じて、AWS がどのように最適なエネルギー効率の実現をサポートするかについてです。
共に実行するために設計された
これらの発表を興奮させるのは、単一の機能そのものではなく、それらが一体となって何を表しているかです。AWS と NVIDIA の 15 年にわたるパートナーシップは、GPU からネットワーク、マネージドサービス層に至るまで、エンドツーエンドで最適化された AI インフラストラクチャのフルスタックを生み出しました。それを自分でつなぎ合わせる必要はありません。すぐに実行できる状態になっています。
今週 GTC に参加される方は、AWS のブースにお越しください。ライブデモをご覧になり、ブース内シアターのセッションに参加し、AWS Swag Factory でカスタマイズされたグッズをゲットしてください。
2026 年 NVIDIA GTC における AWS を訪問して、会議で AWS が何を行っているかすべてをご覧ください。
著者について

デビッド・ブラウン
デビッド・ブラウンは、AWS コンピューティングおよび機械学習(ML)サービスのバイスプレジデントです。この役職において、Amazon EC2、Amazon Container Services、AWS Lambda、Amazon Bedrock、Amazon SageMaker を含むすべての AWS コンピューティングおよび ML サービスの構築を担当しています。これらのサービスはすべての AWS 顧客に利用されていますが、同時に AWS 内部の Amazon アプリケーションの多くを支える基盤となっています。また、AWS Outposts のような新しいソリューションも統括しており、これにより AWS サービスを顧客のプライベートデータセンター内に展開することが可能になります。
原文を表示

AI is moving fast, and for most of our customers, the real opportunity isn’t in experimenting with it—it’s in running AI in production where it drives meaningful business outcomes. This means building systems that run reliably, perform at scale, and meet your organization’s security and compliance requirements.
Today at NVIDIA GTC 2026, AWS and NVIDIA announced an expanded collaboration with new technology integrations to support growing AI compute demand and help you build and run AI solutions that are production-ready. These integrations span accelerated computing, interconnect technologies, and model fine-tuning and inference. They include:
- The deployment of more than 1 million NVIDIA GPUs across AWS Regions starting in 2026
- Amazon Elastic Compute Cloud (Amazon EC2) support for NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs—first among major cloud providers
- Interconnect acceleration for disaggregated LLM inference with NVIDIA NIXL on AWS Elastic Fabric Adapter (EFA)
- 3x faster Apache Spark performance using Amazon EMR on Amazon Elastic Kubernetes Service (Amazon EKS) with Amazon EC2 G7e instances, powered by NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs
- Expanded NVIDIA Nemotron model support on Amazon Bedrock.
Major announcements at NVIDIA GTC 2026
Scaling AI infrastructure with expanded GPU options and optimized interconnect
Accelerating compute capacity in the agentic AI era
Starting in 2026, AWS will add more than 1 million NVIDIA GPUs including Blackwell and Rubin GPU architectures across our global cloud regions. AWS offers the broadest collection of NVIDIA GPU-based instances of any cloud provider to power a diverse set of AI/ML workloads. AWS and NVIDIA are also collaborating on Spectrum networking and other infrastructure areas, adding to over 15 years of joint innovation between our two companies.
AWS’s advanced cloud and AI infrastructure provides enterprises, startups, and researchers with the infrastructure needed to build and scale agentic AI systems—capable of reasoning, planning, and acting autonomously across complex workflows.
New Amazon EC2 instances with NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs
Today, we announced that Amazon EC2 instances accelerated by NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs are coming soon. AWS is the first major cloud provider to announce support for RTX PRO 4500 Blackwell Server Edition GPUs. These instances are well-suited for a wide range of workloads, including data analytics, conversational AI, content generation, recommender systems, video streaming, video rendering, and other graphics workloads.
Amazon EC2 instances accelerated by NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs will be built on the AWS Nitro System, a combination of dedicated hardware and lightweight hypervisor which delivers practically all of the compute and memory resources of the host hardware to your instances for better overall resource utilization and performance. The Nitro System’s specialized hardware, software, and firmware are designed to enforce restrictions so that nobody, including anyone at AWS, can access your sensitive AI workloads and data. In addition, the Nitro System supports firmware updates, bug fixes, and optimizations while the system remains operational. These capabilities within the Nitro System enable the enhanced resource efficiency, security, and stability that AI, analytics, and graphics workloads require in production.
Accelerating interconnect for disaggregated LLM inference with NVIDIA NIXL on AWS EFA and Trainium
As model sizes grow, communication overhead between GPUs or Trainium can become a bottleneck. Today, we announced support for NVIDIA Inference Xfer Library (NIXL) with AWS EFA to accelerate disaggregated Large Language Model (LLM) inference on Amazon EC2, across NVIDIA GPUs and AWS Trainiums. Accelerating disaggregated inference is critical for scaling modern AI workloads because it enables efficient overlap of communication and computation while minimizing communication latency and maximizing GPU utilization. This integration enables high-throughput, low-latency KV-cache data movement between GPU compute nodes performing token generation and distributed memory resources that store KV-cache state. It also provides the flexibility to build inference clusters using any combination of GPU and Trainium EFA-enabled EC2 instances. NIXL with EFA integrates natively with popular open-source frameworks such as NVIDIA Dynamo, vLLM, and SGLang, delivering improved inter-token latency and more efficient KV-cache memory utilization.
Accelerating data analytics with Amazon EMR and NVIDIA GPUs
Running Apache Spark 3x faster using Amazon EMR on Amazon EKS with G7e instances
Data engineers and data scientists frequently face hours-long data processing pipelines that slow AI/ML model iteration and business intelligence generation. We’re seeing significant performance gains for these workloads—AWS and NVIDIA deliver 3x faster performance for Apache Spark workloads with Amazon EMR on EKS on G7e instances. This performance results from joint AWS-NVIDIA engineering collaboration optimizing GPU-accelerated analytics by combining Amazon EMR on EKS with NVIDIA’s RTX PRO 6000 architecture. With Amazon EMR and G7e instances, data engineers and data scientists can accelerate time-to-insight for AI/ML feature engineering, complex ETL transformations, and real-time analytics at scale. Customers running large-scale data processing pipelines can cut the time needed to run analytics while maintaining full compatibility with existing Spark applications.
Expanding NVIDIA Nemotron model support on Amazon Bedrock
Fine-tuning Nemotron models in Amazon Bedrock with Reinforcement Fine-Tuning (Coming soon)
Developers will soon be able to fine-tune NVIDIA Nemotron models directly on Amazon Bedrock using Reinforcement Fine-Tuning (RFT). This is significant for teams that need to align model behavior to specific domains, whether that’s legal, healthcare, finance, or any other specialized field. Reinforcement fine-tuning lets you shape how a model reasons and responds, not just what it knows. And because this runs natively on Amazon Bedrock, there’s zero infrastructure overhead. You define the task, provide the feedback signal, and Bedrock handles the rest. Learn about Reinforcement Fine-Tuning in Amazon Bedrock.
Nemotron 3 Super on Amazon Bedrock (Coming soon)
NVIDIA Nemotron 3 Super—a hybrid MoE model built for multi-agent workloads and extended reasoning—is coming soon to Amazon Bedrock. Designed to enable AI agents to maintain accuracy across complex, multi-step workflows, it powers use cases across finance cybersecurity, retail , and software development—delivering fast, cost-efficient inference through a fully managed API.
Improving energy efficiency and sustainability
As AI workloads scale, performance per watt isn’t just a sustainability metric—it’s a competitive advantage. In this NVIDIA GTC session, Amazon CSO Kara Hurst will join sustainability leaders from Equinix and PepsiCo to discuss how AI is transforming enterprise energy and infrastructure at scale—from data centers as active grid participants to AI as an enterprise efficiency engine, and how AWS can help you achieve optimal energy efficiency with AWS infrastructure being 4.1x more energy-efficient than on-premises data centers.
Built to run, together
What makes these announcements exciting isn’t any single capability—it’s what they represent together. Fifteen years of partnership between AWS and NVIDIA has produced a full stack of AI infrastructure optimized end to end, from the GPU to the network to the managed services layer. You don’t have to stitch it together yourselves. It’s ready to run.
If you’re at GTC this week, come find us at the AWS booth. Check out live demos, catch our in-booth theater sessions, and pick up customized swag with AWS Swag Factory.
Visit AWS at NVIDIA GTC 2026 to see everything AWS has going on at the conference.
About the authors

David Brown
David Brown is the Vice President of AWS Compute and Machine Learning (ML) Services. In this role he is responsible for building all AWS Compute and ML services, including Amazon EC2, Amazon Container Services, AWS Lambda, Amazon Bedrock and Amazon SageMaker. These services are used by all AWS customers but also underpin most of AWS’s internal Amazon applications. He also leads newer solutions, such as AWS Outposts, that bring AWS services into customers’ private data centers.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み