NVIDIA Ising、フォールトトレラント量子システム構築のためのAI駆動ワークフローを導入
NVIDIAは、量子プロセッサ構築のための世界初のオープンAIモデルファミリー「Ising」を発表し、キャリブレーションとエラー訂正のモデルドメインで量子システムの実用化を加速する。
キーポイント
世界初の量子プロセッサ構築用オープンAIモデル
NVIDIA Isingは、量子プロセッサの設計・構築を支援する世界初のオープンAIモデルファミリーとして発表された。
2つの主要モデルドメイン
Ising Calibration(キャリブレーション)とIsing Error Correction(エラー訂正)の2つのモデルドメインで提供され、量子システムの信頼性向上を目指す。
フォールトトレラント量子システムの実現支援
AIを活用したワークフローにより、エラーに強い量子コンピューティングシステムの構築プロセスを効率化する。
量子ハードウェア開発の民主化
オープンモデルとして提供されることで、より広範な研究者や開発者が量子プロセッサ開発にアクセスできる環境を整備する。
影響分析・編集コメントを表示
影響分析
この発表は、量子コンピューティングの実用化に向けた重要なマイルストーンであり、AIと量子技術の融合が新たな段階に入ったことを示している。NVIDIAのプラットフォーム戦略が量子分野にも拡大することで、量子ハードウェア開発のエコシステム形成に大きな影響を与える可能性がある。
編集コメント
量子コンピューティングの実用化に向けたハードルであるエラー訂正問題に、AIを活用して取り組む画期的なアプローチ。量子とAIの融合が次の技術フロンティアとなる可能性を示唆する重要な発表。
NVIDIA Isingは、量子プロセッサの構築のためのオープンなAIモデルの世界初のファミリーであり、Ising Calibration(キャリブレーション)とIsing Decoding(デコーディング)の2つのモデルドメインで提供されます。
両者は、量子コンピューティングにおける根本的な課題——量子ビットが本質的にノイズにさらされていること——に対処しています。最高の量子プロセッサでも、約1000回の演算に1回程度の誤りが生じます。科学や企業の課題に対する有用なアクセラレータとなるためには、誤り率を1兆回に1回以下まで低下させる必要があります。そのギャップを大規模に埋めるための最も有望な道筋がAIです。
キャリブレーションは、各量子プロセッサのノイズを理解し、最適なパフォーマンスを達成するために調整するプロセスです。キャリブレーションは誤りを最小化しますが、量子システムのノイズのため、誤りは蓄積する前に古典コンピュータによってリアルタイムで修正されなければなりません。このプロセスは量子誤り訂正デコーディング(Quantum Error Correction Decoding)と呼ばれます。キャリブレーションとデコーディングの両者は計算集約型であり、進歩を促進するために改善された手法が必要です。Isingは、数百万の量子ビットへのスケーリングに対応する技術を用い、キャリブレーションおよび誤り訂正デコーディングにおいて高度なパフォーマンスを提供します。
NVIDIA Isingは、オープンなベースモデル、トレーニングフレームワーク、およびファインチューニング、量子化(Quantization)、デプロイメントのためのワークフローを提供します。事前学習済みモデルは、箱から出してすぐにトップパフォーマンスを発揮し、すべてがオープンであるため、ユーザーは独自のハードウェアおよびノイズ特性に合わせて専門化することが可能でありながら、機密性の高いQPU(Quantum Processing Unit)データをオンサイト(自社内)で保持できます。
本稿では、NVIDIA Ising がどのようにしてユーザーが基本モデルを選択し、独自のモデルをトレーニングし、ファインチューニングし、量子化し、必要に応じて最適化された推論ワークフローを展開するための出発点を提供し、QPU(量子プロセッシングユニット)のパフォーマンスを向上させ、有用な問題を解決できる Quantum-GPU スーパーコンピュータへのスケーリングパスを提供する方法について詳しく解説します。
NVIDIA Ising ファミリーは、2 つの画期的なモデルで始まります:
NVIDIA Ising Calibration:QPU(量子プロセッシングユニット)のキャリブレーションタスクを自動化するためのビジョン・ランゲージモデル(VLM)。
NVIDIA Ising Decoding:量子エラー訂正中に必要とされる高度なデコーディングに対応する、2 つの 3D CNN(三次元畳み込みニューラルネットワーク)モデルで構成されます。
動画 1. NVIDIA Ising は有用な量子コンピューティングを加速します
NVIDIA Ising Calibration
NVIDIA Ising Calibration は、量子コンピューティングの科学実験の結果を理解し、それが期待される傾向と比較してどうであるかを把握できる VLM(ビジョン・ランゲージモデル)です。
この VLM は、測定結果に応答し、量子プロセッサの動作が所定の仕様内に収まるまで積極的にキャリブレーションを行う、エージェント型ワークフローで使用できます。
Ising-Calibration-1 モデルは、超伝導量子ビット、量子ドット、イオン、中性原子、ヘリウム上の電子など、複数の量子ビットモダリティにまたがるパートナーから提供された情報に基づいて生成されたデータを用いてトレーニングされました。
量子キャリブレーションモデルの評価に関する標準ベンチマークが存在しない中、NVIDIAは量子パートナーと協力し、実際の量子コンピュータの出力を含む世界初のエージェント型量子コンピュータキャリブレーション用ベンチマーク「QCalEval」を開発しました。
このベンチマークは、関連するキャリブレーションタスクにおける任意のモデルの有効性を評価するための6つのセマンティックスコアリングテストで構成されています。QCalEvalは、モデルが実験結果を解釈し、結果を分類し、その重要性を評価し、適合度と主要な特徴を assess し、実行可能な次のステップの推奨事項を生成する能力を測定します。QCalEvalベンチマーク、モデルアーキテクチャ、および評価結果の詳細はこちらをご覧ください。
Ising-Calibration-1は、さまざまなパラメータを持つ最先端のオープンおよびクローズドモデルを繰り返し上回るパフォーマンスを示しています。図1に示すように、Ising Calibration 1はGemini 3.1 Proより平均で3.27%、Claude Opus 4.6より9.68%、GPT 5.4より14.5%高いスコアを記録しています。350億パラメータのVLM(Vision-Language Model)は、NVIDIA Grace BlackwellやNVIDIA Vera Rubinなどのデータセンター向けGPU、およびNVIDIA DGX Sparkのようなコンシューマーカードに適しています。
図1. Ising Calibration 1は、QCalEvalベンチマークにおいて、すべての同等のオープンモデルを箱から出してすぐに上回ることで、AIおよび量子コンピュータのキャリブレーションにおける進歩を示しています
NVIDIA NeMo Agent Toolkit を使用することで、開発者は幅広いモデルと統合して校正プロセスを自動化するエージェントを構築できます。Ising-Calibration-1 モデルとこのアプローチを組み合わせることで、開発者は人間の監視を最小限に抑えながら校正ワークフローを効果的に自動化できます。
NVIDIA のパートナー企業は、このエージェント型ワークフローを、幅広い校正および制御ソフトウェアスタックや、Coda、Cursor、Claude Code などの人気コード支援エージェントに統合していることを実証しています。
GitHub のブループリントを確認し、エージェントを用いて Ising-Calibration-1 をデプロイする方法について詳しくご覧ください。
NVIDIA Ising Decoding
NVIDIA Ising Decoding 学習フレームワークを使用することで、量子プロセッサ(QPU)の構築者、運用者、デコーダ開発者は、小規模な 3D CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)AI デコーダを学習できます。時空間両方でスケーリングするリアルタイム運用は、レイテンシの低減と論理エラー率の改善に寄与します。これらの事前デコーダは、大量の局所化されたシンドロームエラーを処理することで、デコーダの速度と精度を向上させます。また、任意のコード距離にスケーリング可能であり、チームが QPU に合わせてスケールする量子誤り訂正デコーダを、ラティスサージ(lattice surgery)に至るまで展開することを支援します。
ユーザーはノイズモデル、回転表面符号の方向、およびモデル深度(深いほど精度が高い)を定義するだけでよい。トレーニングフレームワークは、NVIDIA cuQuantum内のcuStabilizerライブラリとPyTorchを使用して合成トレーニングデータを生成し、タスクに対するデコーディング性能を最適化する3次元CNN(Convolutional Neural Network)を学習する。ユーザーはレイヤー数を増減することも選択でき、これにより実行時間と精度のトレードオフが生じる。最適なCNNモデルは、符号距離、物理エラー率、グローバルデコーダの有効性、およびラウンドトリップレイテンシ予算によって決まる。
精度か速度か:適切な基本モデルの選択
HuggingFaceでは、精度または速度のいずれかに最適化された2つの基本モデル例が提供されている。
Ising-Decoder-SurfaceCode-1-Fastはレイヤー数が少なく、受容野(receptive field)が9であり、9x9x9サイズの入力体積で学習されている(ただし推論時には任意の入力体積を使用可能)。このモデルは約91万2000個のパラメータを持つ。その小さなサイズのためGPU上で効率的に動作するが、より大きなモデルと比較すると論理エラー率(Logical Error Rate: LER)の改善度は小さい。Fast事前デコーダにPyMatchingを組み合わせる場合、d=13、p=0.003の条件下で、PyMatching単独よりも2.5倍高速であり、1.11倍高精度である。
Ising-Decoder-SurfaceCode-1-Accurate はレイヤー数が多く、受容野(receptive field)が 13 で、13x13x13 のサイズの入力体積で学習されます。このモデルには約 179 万個のパラメータがあります。その大きなサイズのため、Fast decoder に比べてより長いエラーチェーンを訂正できますが、実行には時間がかかります。このエンドツーエンドの速度が対象となる QPU(Quantum Processing Unit)の望ましい範囲内にある限り、LER(Logical Error Rate:論理エラー率)の大幅な向上は、追加されるランタイムコストに見合う価値があります。Accurate pre-decoder に PyMatching を組み合わせた場合、d=13、p=0.003 の条件下では、PyMatching より 2.25 倍高速で、1.53 倍正確です。
図 2 は、最小重み完全マッチング(MWPM:Minimum Weight Perfect Matching)のベースラインと比較して、高速モデルと正確なモデルのトレードオフを示しています。これは、特定の物理エラー率およびコード距離(code distance)が与えられた場合、事前デコーダモデルを展開するための理想的な領域を示しています。例えば、d=13 のデータで学習された正確なモデルは、p=0.003 において d=31 で LER を 3 倍改善できます。
図 2. NVIDIA DGX GB300 で実行される高速および正確な事前デコーダと、NVIDIA Grace Neoverse-V2 CPU で実行される PyMatching
このアプローチは、さまざまなノイズモデルにわたって LER とレイテンシを改善し、Union Find、相関マッチング(correlated matching)、および機械学習ベースのデコーダをグローバルデコーダとしてサポートし、よりスケーラブルな量子誤り訂正(quantum error correction)戦略を可能にします。
また、量子コンピューティングに必要な低レイテンシを提供するために設計された、NVIDIA CUDA-Q QEC、CUDAQ-Realtime、および NVIDIA NVQLink を基盤としたリアルタイム API も開発しました。Accurate モデル + PyMatching、GB300、FP16 精度、物理エラー率 0.003、104 ラウンド、表面符号 d=13 の条件下で、2.33 μs/ラウンドの処理速度を実現し、2.25 倍の高速化と 1.53 倍のエラー率改善(LER: Logical Error Rate)を達成できることを示しました。
13 個の GB300 GPU、FP8 精度、物理エラー率 0.003、1000 ラウンド、表面符号 d=13 を想定した場合、高速モデルは 0.11 μs/ラウンドを達成できると予測しています。このプレデコーダモデルアーキテクチャは、デコーダの高速化と精度向上を目的として設計されており、有用な耐障害性量子コンピューティングへの実現に近づきます。詳細は CUDA-Q QEC ブログ記事をご覧ください。
NVIDIA Ising デコーダモデルアーキテクチャについてさらに学び、幅広い分析と結果を確認してください。
NVIDIA Ising のオープンリソースで構築を開始する
NVIDIA Ising モデルファミリーは完全にオープンです。重み、トレーニングフレームワーク、データ、ベンチマーク、レシピが提供されており、他のユーザーが特定の QPU(Quantum Processing Unit)向けに独自のモデルやバリアントを修正、デプロイ、トレーニング、ファインチューニングできるようになっています。
モデルの重み
Ising Calibration 1 および Ising Decoder SurfaceCode 1 の全パラメータチェックポイントが Hugging Face で利用可能であり、Ising Calibration 1 は NVIDIA NIM および NVIDIA Build を通じても入手可能です。NVIDIA Open Model License により、QPU のビルダーおよびオペレーターはデータの制御を維持し、どこにでもデプロイする柔軟性を得ることができます。
トレーニングフレームワーク
NVIDIAは、Ising Decoder SurfaceCode 1の完全なトレーニングフレームワークを公開しています。これにより、ユーザーはNVIDIA cuQuantumライブラリとNVIDIA cuStabilizerを使用して合成データをリアルタイムで生成しながら、PyTorchを用いてトレーニングを行うことができます。このフレームワークにより、開発者は特定のQPU(Quantum Processing Unit:量子演算装置)のノイズ特性に合わせたデコーダーモデルを構築できます。
デプロイレシピ
主要な推論エンジン向けに、すぐに使用可能なクックブックと例が提供されており、それぞれ設定テンプレート、パフォーマンスチューニングのガイダンス、参照スクリプトが含まれています:
リアルタイムデコーディングは、CUDA-Q QEC(Quantum Error Correction:量子誤り訂正)において、NVIDIA TensorRTを使用してPyMatchingとDecoder SurfaceCode 1でリアルタイムの事前デコーディングを実行する例です。
Ising-Decoding、cuStabilizer、およびPyTorchを用いてデコーダーをトレーニングし、量子化します。
Quantum calibration agent(量子キャリブレーションエージェント)は、NVIDIA Nemo Agent Toolkitを使用してIsing Calibration 1と連携し、量子キャリブレーション実験の自動化を迅速にセットアップするためのエージェントワークフローを展開するスクリプトです。
ファインチューニングおよび量子化レシピ
NVIDIA Isingのカスタマイズクックブックを探索し、特定のドメイン(LoRA/SFT)向けに量子化またはファインチューニングを行うか、エージェントの推論能力(GRPO/DAPO)を向上させてください:
Ising-Decoder-SurfaceCode-1のFP8への量子化。
オープンデータセットとQCalEvalベンチマーク
NVIDIA Ising Calibration 1は、パートナーおよび協力企業から提供された実際のQPUデータに基づいて構築されています。また、このタスクにおけるモデルの有効性を評価するためのセマンティック量子キャリブレーションベンチマークも公開されています。
QCalEval に関する詳細は、この研究論文に記載されており、GitHub でこれを実行するためのスクリプトも公開されています。
HuggingFace 上のデータセットを確認してください。
はじめに
NVIDIA Ising を始めるために、以下のリソースが利用可能です:
Ising Decoding 学習フレームワークおよびクックブックの GitHub リポジトリ(Apache 2.0 ライセンス)。
Ising Calibration NIM:build.nvidia.com および NVIDIA NGC Catalog で利用可能。
Ising Calibration エージェントワークフローおよびクックブックの GitHub リポジトリ(Apache 2.0 ライセンス)。
原文を表示
NVIDIA Ising is the world’s first family of open AI models for building quantum processors, launching with two model domains: Ising Calibration and Ising Decoding.
Both target the fundamental challenge in quantum computing—qubits are inherently noisy. The best quantum processors make an error roughly once in every thousand operations. To become useful accelerators for scientific and enterprise problems, error rates must drop to one in a trillion or better. AI is the most promising path to closing that gap at scale.
Calibration is the process of understanding the noise in each quantum processor and tuning it to achieve the best possible performance. Calibration minimizes error, but because of noise in quantum systems, errors must be corrected in real time by a classical computer, faster than they accumulate. This process is called quantum error correction decoding. Both calibration and decoding are computationally intensive and need improved methods to drive progress. Ising delivers advanced performance on calibration and error correction decoding, using techniques for scaling to millions of qubits.
NVIDIA Ising provides open base models, a training framework, and workflows for fine-tuning, quantization, and deployment. The pre-trained models deliver top performance out of the box, and because everything is open, users can also specialize for their own hardware and noise characteristics while keeping proprietary QPU data on-site.
In this post, we dive into how NVIDIA Ising delivers starting points for users to select base models, train their own, fine-tune, quantize, and deploy optimized inference workflows wherever needed, improving QPU performance and providing a path to scale to Quantum-GPU Supercomputers capable of solving useful problems.
The NVIDIA Ising family launches with two breakthrough models:
NVIDIA Ising Calibration: A vision-language model (VLM) model for automating QPU calibration tasks.
NVIDIA Ising Decoding: Consists of two 3D CNN models for demanding decoding needed during quantum error correction.
Video 1. NVIDIA Ising accelerates useful quantum computing
NVIDIA Ising Calibration
NVIDIA Ising Calibration is a VLM capable of understanding quantum computing scientific experiment output and how it compares to expected trends.
This VLM can be used in an agentic workflow that responds to measurement results and actively calibrates a quantum processor until its operation falls within desired specifications.
The Ising-Calibration-1 model was trained on data generated from information provided by partners spanning multiple qubit modalities, including superconducting qubits, quantum dots, ions, neutral atoms, electrons on Helium, and others specializing in calibration and control.
In the absence of a standard benchmark for evaluating quantum calibration models, NVIDIA collaborated with quantum partners to develop QCalEval, the world’s first benchmark for agentic quantum computer calibration, containing real quantum computer outputs.
This benchmark is a six-part semantic scoring test that assesses any model’s effectiveness at relevant calibration tasks. QCalEval measures a model’s ability to interpret experimental results, classify outcomes, evaluate their significance, assess fit quality and key features, and generate actionable next-step recommendations. Learn more about the QCalEval benchmark, along with model architecture and evaluation results
Ising-Calibration-1 repeatedly outperforms state-of-the-art open and closed models of a range of parameters. As shown in Figure 1, Ising Calibration 1 scores 3.27% better on average than Gemini 3.1 Pro, 9.68% better than Claude Opus 4.6, and 14.5% better than GPT 5.4. The 35B parameter VLM is suited for data center GPUs such as NVIDIA Grace Blackwell and NVIDIA Vera Rubin, and consumer cards like NVIDIA DGX Spark.
Figure 1. Ising Calibration 1 advances AI and quantum computing calibration by outperforming all comparable open models out of the box, on the QCalEval benchmark
With the NVIDIA NeMo Agent Toolkit, developers can build agents that integrate with a wide range of models to automate the calibration process. Using this approach with the Ising-Calibration-1 model, developers can effectively automate calibration workflows with minimal human oversight.
NVIDIA partners have demonstrated integration of this agentic workflow within a wide range of calibration and control software stacks, and through popular coding agents, like Coda, Cursor, or Claude Code.
Learn more about deploying Ising-Calibration-1 with an agent by checking out the blueprint on GitHub.
NVIDIA Ising Decoding
Using the NVIDIA Ising Decoding training framework, QPU builders, operators, and decoder developers can train small 3D CNN AI decoders. Real-time operations that scale in both space and time help improve latency and logical error rates. These pre-decoders accelerate and improve decoder accuracy by handling a large quantity of localized syndrome errors. They can also scale to arbitrary code distances, helping teams deploy quantum error correction decoders that will scale with their QPUs all the way to lattice surgery.
Users need only define their noise model, the orientation of the rotated surface code, and model depth (deeper is more accurate). The training framework then uses the cuStabilizer library within NVIDIA cuQuantum and PyTorch to generate synthetic training data and train a 3D CNN that optimizes decoding performance for the task. Users can also opt for more or fewer layers, which creates a runtime and accuracy trade-off. The best CNN model depends on the code distance, physical error rate, global decoder effectiveness, and round-trip latency budget.
Accuracy or speed: selecting the right base model
Two base-model examples, optimized for either accuracy or speed, are available on HuggingFace.
Ising-Decoder-SurfaceCode-1-Fast has fewer layers, a receptive field of 9, and is trained on input volumes of size 9x9x9 (although arbitrary input volumes can be used during inference). This model has roughly 912,000 parameters. Due to its small size, it runs efficiently on a GPU but provides less improvement to the logical error rate (LER) compared to a larger model. The Fast pre-decoder plus PyMatching is 2.5x faster than PyMatching and 1.11x more accurate at d=13 for p=0.003.
Ising-Decoder-SurfaceCode-1-Accurate has more layers, a receptive field of 13, and is trained on input volumes of size 13x13x13. This model has roughly 1.79 million parameters. Given its larger size, it can correct larger error chains compared to the Fast decoder, but takes longer to run. As long as this end-to-end speed is in the desired range for the target QPU, the large improvement in LER may be worth the added runtime cost. The Accurate pre-decoder plus PyMatching is 2.25x faster than PyMatching and 1.53x more accurate than PyMatching for d=13 at p=0.003
Figure 2 shows the trade-off between fast and accurate models, compared to the minimum weight perfect matching (MWPM) baseline. It shows the ideal regime for deploying the pre-decoder model given some physical error rate and code distance. For example, the accurate model can deliver 3x improvement in LER at d=31 for p=0.003, when trained on d=13 data.
Figure 2. Fast and accurate pre-decoder run on NVIDIA DGX GB300 with PyMatching run on NVIDIA Grace Neoverse-V2 CPU
This approach improves LER and latency across a range of noise models and supports Union Find, correlated matching, and machine-learning decoders as global decoders, enabling more scalable quantum error correction strategies.
We have also developed a real-time API built on NVIDIA CUDA-Q QEC, CUDAQ-Realtime, and NVIDIA NVQLink, designed to deliver the low latency needed for quantum computing. We have shown that for the Accurate model + PyMatching, GB300, FP16 Precision, physical error rate of 0.003, 104 rounds, surface code d=13, we can achieve 2.33 μs / round, providing a 2.25x speedup, and 1.53x improvement in LER.
We projected that, given 13 GB300 GPUs, FP8 precision, physical error rate of 0.003, 1000 rounds, Surface code d=13, the fast model can achieve 0.11 μs / round. This pre-decoder model architecture is designed to accelerate and improve the accuracy of decoders, bringing us closer to useful fault-tolerant quantum computing. Read more in our CUDA-Q QEC blog post.
Learn more about NVIDIA Ising Decoder model architecture and explore a wide range of analysis and results.
Start building with NVIDIA Ising open resources
The NVIDIA Ising model family is fully open. Weights, training frameworks, data, benchmarks, and recipes are provided to enable others to modify, deploy, train, and fine-tune their own models and variants for their specific QPUs.
Model weights
Full parameter checkpoints for Ising Calibration 1 and Ising Decoder SurfaceCode 1 are available on Hugging Face, with Ising Calibration 1 also available through NVIDIA NIM and NVIDIA Build. The NVIDIA Open Model License gives QPU builders and operators the flexibility to maintain data control and deploy anywhere.
Training framework
NVIDIA is releasing a complete training framework for Ising Decoder SurfaceCode 1 that enables users to generate synthetic data with the NVIDIA cuQuantum library, NVIDIA cuStabilizer on the fly, while training with PyTorch. This framework enables developers to produce decoder models tailored to their specific QPU noise characteristics.
Deployment recipes
Ready-to-use cookbook and examples are available for major inference engines, each with configuration templates, performance tuning guidance, and reference scripts:
Real-time decoding is an example of running real-time pre-decoding with Decoder SurfaceCode 1 and PyMatching using NVIDIA TensorRT in CUDA-Q QEC.
Training a decoder with Ising-Decoding, cuStabilizer, and PyTorch, and quantizing it.
Quantum calibration agent is a script for deploying an agentic workflow using Ising Calibration 1 with the NVIDIA Nemo Agent Toolkit to quickly set up quantum calibration experiment automation.
Fine-tuning and quantization recipes
Explore NVIDIA Ising customization cookbooks to quantize or fine-tune for a specific domain (LoRA/SFT) or advance its agentic reasoning capabilities (GRPO/DAPO):
Quantization to FP8 for Ising-Decoder-SurfaceCode-1.
Open datasets and QCalEval benchmark
NVIDIA Ising Calibration 1 is built on real QPU data provided by partners and collaborators. A semantic quantum calibration benchmark has also been released to evaluate model effectiveness for this task.
The details on QCalEval are available in this research paper, with a script to run this on GitHub.
Review the data set on HuggingFace.
Get started
NVIDIA Ising is available with the following resources for getting started:
Ising Decoding training framework and cookbook GitHub under Apache 2.0.
Ising Calibration NIM: available on build.nvidia.com and the NVIDIA NGC Catalog.
Ising Calibration agentic workflow and cookbook GitHub under Apache 2.0.
関連記事
プロテオーム規模でのタンパク質構造予測を加速する方法
NVIDIAが、タンパク質が単体ではなく相互作用によって生物学的プロセスを制御する点に着目し、プロテオーム規模でのタンパク質構造予測を高速化する手法を提案している。
Kubernetes上でSlurmを使用した大規模GPUワークロードの実行
NVIDIAが、オープンソースのクラスタ管理システムSlurmをKubernetesと統合し、大規模GPUワークロードを効率的に管理・スケジューリングする方法を紹介している。SlurmはTOP500システムの65%以上で採用されている実績を持つ。
約30行のPythonとNVIDIA nvCOMPでチェックポイントコストを削減
NVIDIAが、LLM学習時のチェックポイント保存コストを削減するPythonスクリプトを公開した。約30行のコードでモデル重み・オプティマイザ状態・勾配の圧縮保存を実現し、ストレージコストとI/O負荷を低減できる。