NVIDIA と AWS が大規模な AI の実用化に向けて協力
NVIDIA と AWS は、インフラと技術の統合を通じて企業による AI の大規模な生産環境への実装を加速させる協力を開始した。
キーポイント
大規模生産環境への対応
両社は単なる実験段階を超え、企業が AI を本番環境で安定して運用するための基盤整備に注力する方針を示している。
インフラと技術の統合
NVIDIA のハードウェア・ソフトウェアスタックと AWS のクラウドインフラを深く統合し、実装の複雑さを低減させる。
企業導入の加速化
連携により、企業が AI 技術を自社の業務に組み込むまでの時間を短縮し、競争力を高めることを目指す。
影響分析・編集コメントを表示
影響分析
この協力は、AI 開発から本番運用までのギャップを埋める重要なステップであり、特に大規模データを扱う企業の導入障壁を下げると期待される。結果として、業界全体で AI の実用化スピードが加速し、競争優位性を獲得するためのインフラ整備が標準化される可能性がある。
編集コメント
プレスリリース色が強い内容ですが、AI の「実験」から「運用」へ移行する際のインフラ課題解決という点では実務的な意義があります。
大規模な AI システムの構築は困難を伴い、低遅延推論、高速ベクトル検索、優れた GPU の価格対性能比、そして運用複雑性を増やすことなく拡張可能なインフラストラクチャが必要です。
NVIDIA と Amazon Web Services (AWS) による最新の取り組みは、これらの制約すべてに対応しています。Amazon OpenSearch および Amazon EC2 にわたって、NVIDIA AI インフラストラクチャが企業に対し、大規模な生産環境で AI を展開するためのより実用的な道筋を提供しています。
NVIDIA RTX PRO 4500 Blackwell Server Edition GPU で駆動される EC2 G7 インスタンスは、AI、グラフィックス、ビデオ、データ分析ワークロードに対する計算層を拡張し、一方、NVIDIA cuVS ライブラリ(cuVS)は、OpenSearch Serverless において GPU 駆動のベクトルインデックスをデフォルトとすることで検索層を加速します。さらに、AWS が NVIDIA GB300 に対して「NVIDIA Exemplar Cloud」ステータスを達成したことで、顧客はトレーニングワークロードに対して最適化された最高性能を提供されていることを信頼できます。
NVIDIA RTX PRO 4500 Blackwell Server Edition マルチワークロード GPU で駆動される新しい Amazon EC2 G7 インスタンス
Amazon EC2 G7 インスタンスは、AI 推論、グラフィックス、空間コンピューティング、GPU アクセラレーションされたデータ分析のために NVIDIA RTX PRO 4500 Blackwell Server Edition GPU を AWS に持ち込みます。これは、顧客が管理する GPU プラットフォームの運用オーバーヘッドを伴わずにパフォーマンスが必要な生産ワークロード向けに設計された新しいインスタンスタイプです。
G6 インスタンスと比較して、G7 は AI 推論性能で最大 4.6 倍、グラフィックス性能で最大 2.1 倍の向上を実現し、Apache Spark ワークロード向けに NVIDIA cuDF ライブラリを活用した Amazon EMR 上での GPU アクセラレーションされたデータ分析を大幅に高速化します。
最大 8 基の GPU、合計 256GB の GPU メモリ、700 Gbps の EFA(Elastic Fabric Adapter)対応ネットワーク、および最大 7.6TB のローカル NVMe SSD ストレージをサポートし、1 基から 8 基までの GPU 構成に加え、ベアメタル環境も近日公開予定となるため、G7 インスタンスを使用すれば、ワークロードに合わせてインフラを最適化でき、過剰なプロビジョニングを防ぐことができます。
このプラットフォームの多様性により、AI チームは低遅延の推論を実現できます。メディア・エンターテインメントチームは高解像度のビデオワークフローとレンダリングが可能になります。シミュレーション、コンピュータ支援設計(CAD)、仮想デスクトップインフラストラクチャ(VDI)、ゲーム、空間コンピューティングの各チームは、グラフィックス集約型アプリケーションに同じインスタンスタイプを使用できます。またデータチームは、GPU メモリ、ローカルストレージ、ネットワークの改善点を分析パイプラインやベクトルデータベースワークロードに応用できます。
G7 インスタンスは、AWS Deep Learning Amazon Machine Images(AMIs)、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS、およびグラフィックス向け AMI を通じてアクセス可能です。また、近日中に Amazon SageMaker AI にも対応予定です。
NVIDIA cuVS が Amazon OpenSearch における GPU アクセラレーションされたベクトル検索をデフォルトに
Amazon OpenSearch Serverless の次世代は、インフラ管理を必要とせず、エージェント型 AI や動的ワークロードを支えます。これは、すべてのベクトルコレクションに対して NVIDIA cuVS によって駆動される GPU アクセラレーションされたベクトルインデックスをデフォルトの計算リソースとして採用しています。
検索拡張生成やセマンティック検索、推薦システム、エージェント型 AI アプリケーションを構築するチームにとって、この変化は重要です。GPU 駆動のベクトル検索が、専門的な最適化プロジェクトから標準的な AWS の機能へと転換されるのです。
顧客への直接的な影響として、CPU のみのビルドと比較してベクトルインデックス作成が最大 10 倍高速になり、コストは 4 分の 1 に抑えられます。これにより、数十億規模のベクトルデータベースを 1 時間未満で構築することが現実的なものとなります。
OpenSearch Serverless で NVIDIA cuVS をデフォルトにすることで、AWS の顧客は生データから本番環境対応の AI 検索インフラへと、より迅速な道筋を得られます。また、ワークロードがアイドル状態のときに運用オーバーヘッドを削減するサーバーレススケーリングも利用可能です。
AWS が GB300 トレーニング性能で NVIDIA Exemplar Cloud ステータスを達成
AWS は、NVIDIA GB300 におけるトレーニングワークロードに対して NVIDIA Exemplar Cloud ステータスを取得しました。これは、AWS が AI ワークロードのベンチマークに用いる NVIDIA の参照アーキテクチャに対する厳格なパフォーマンス閾値を満たしていることを意味します。
この成果は、AWS と NVIDIA のチームによる深い共同設計の取り組みの結果です。NVIDIA Exemplar Clouds イニシアチブを通じて、開発者や AI リーダーは、大規模なトレーニングに際して一貫性があり高性能なクラウドインフラストラクチャを利用していることを確信できます。これにより、チームはクラウドプロバイダをより高い信頼度で評価でき、総所有コスト(TCO)の改善を図り、AI プロジェクトを計画段階から生産環境へより効率的に移行できるようになります。
これらの進展は、AWS 上の AI インフラストラクチャスタックのすべての層を強化するものです。共通するテーマは同じです:運用チームに追加的な負担をかけずに、大規模なスケールで動作する本番グレードの AI インフラストラクチャを提供することです。
*詳しくは *この AWS ブログ *をご覧ください。*
原文を表示
Building AI systems at scale is demanding, requiring low-latency inference, fast vector search, strong GPU price-performance and infrastructure that can grow without multiplying operational complexity.
NVIDIA’s latest work with Amazon Web Services (AWS) addresses each of those constraints. Across Amazon OpenSearch and Amazon EC2, NVIDIA AI infrastructure is giving enterprises more practical paths to deploy AI at production scale.
EC2 G7 instances powered by NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs expand the compute layer for AI, graphics, video and data analytics workloads, while the NVIDIA cuVS library accelerates the retrieval layer by making GPU-powered vector indexing the default in OpenSearch Serverless. And with AWS achieving NVIDIA Exemplar Cloud status for NVIDIA GB300, customers can trust they’re receiving peak optimized performance for their training workloads.
NVIDIA RTX PRO 4500 Blackwell Server Edition Multi-Workload GPUs Power New Amazon EC2 G7 Instances
Amazon EC2 G7 instances bring NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs to AWS for AI inference, graphics, spatial computing and GPU-accelerated data analytics — delivering a new instance type engineered for production workloads that need performance without the operational overhead of a customer-managed GPU platform.
Compared with G6 instances, G7 delivers up to 4.6x AI inference performance, up to 2.1x graphics performance and significantly faster GPU-accelerated data analytics on Amazon EMR using the NVIDIA cuDF library for Apache Spark workloads.
With support for up to eight GPUs, 256GB of total GPU memory, 700 Gbps of EFA-enabled networking and up to 7.6TB of local NVMe SSD storage — across one-, two-, four- and eight- GPU configurations plus bare metal, coming soon — G7 instances let customers right-size infrastructure for their workloads instead of over-provisioning for them.
The platform’s versatility means AI teams get lower-latency inference. Media and entertainment teams get high-resolution video workflows and rendering. Simulation, computer-aided design, virtual desktop infrastructure, gaming and spatial computing teams get the same instance type for graphics-intensive applications. And data teams can apply the GPU memory, local storage and networking improvements to analytics pipelines and vector database workloads.
G7 instances are accessible through AWS Deep Learning Amazon Machine Images (AMIs), Amazon Deep Learning Containers, Amazon EMR, Amazon EKS, Amazon ECS and graphics AMIs — and coming soon to Amazon SageMaker AI.
NVIDIA cuVS Makes GPU-Accelerated Vector Search the Default in Amazon OpenSearch
The next generation of Amazon OpenSearch Serverless powers agentic AI and dynamic workloads with no infrastructure management required. It uses GPU-accelerated vector indexing, powered by NVIDIA cuVS, as the default compute choice for all vector collections.
For teams building retrieval-augmented generation, semantic search, recommendation systems and agentic AI applications, that shift matters. It turns GPU-powered vector search from a specialized optimization project into a standard AWS capability.
The customer impact is direct: vector indexing up to 10x faster at a quarter of the cost, compared with CPU-only builds — making billion-scale vector databases practical to build in under an hour.
By making NVIDIA cuVS the default in OpenSearch Serverless, AWS customers get a much faster path from raw data to production-ready AI retrieval infrastructure — with serverless scaling that reduces operational overhead when workloads are idle.
AWS Achieves NVIDIA Exemplar Cloud Status for GB300 Training Performance
AWS has achieved NVIDIA Exemplar Cloud status on NVIDIA GB300 for training workloads. This means AWS meets the rigorous performance thresholds that NVIDIA uses to benchmark AI workloads against its reference architecture.
This achievement is the result of deep co-engineering efforts between AWS and NVIDIA teams. Through the NVIDIA Exemplar Clouds initiative, developers and AI leaders can be confident they’re using consistent, high-performance cloud infrastructure for large-scale training, helping teams evaluate cloud providers with greater confidence, improve total cost of ownership and move AI projects from planning to production more efficiently.
Together, these advancements reinforce every layer of the AI infrastructure stack on AWS. The throughline is the same: production-grade AI infrastructure that performs at scale, without adding operational burden to the teams running it.
*Learn more in *this AWS blog*. *
関連記事
Amazon、AIチップ販売でNvidiaに直接挑戦する方針
Amazonは自社開発のAIチップを販売することで、市場を支配するNvidiaに対してより直接的な競争を仕掛ける計画である。
フルスタック推論・学習最適化による AI ファクトリのエネルギー効率最大化
NVIDIA は、AI ファクトリ全体のエネルギー効率を向上させるため、推論と学習の両面で最適化手法を提案している。
NVIDIA Blackwell で DFlash 推測デコーディングを活用し、推論パフォーマンスを最大 15 倍に向上
NVIDIA は、DFlash 推測デコーディング技術を採用することで、Blackwell アーキテクチャ上の推論パフォーマンスを最大 15 倍まで向上させることに成功したと発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み