AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
NVIDIA Developer Blog·2026年4月18日 00:00·約18分で読める

AI物理学でクリーンでモジュール式の原子炉設計を加速

#科学AI#サロゲートモデル#デジタルツイン#NVIDIA PhysicsNeMo#GPU加速計算
TL;DR

NVIDIAは、物理シミュレーションのボトルネックを解消するため、GPU加速とAIサロゲートモデルを活用した原子炉設計用のインタラクティブデジタルツインワークフローを公開した。

AI深層分析2026年4月18日 01:42
3
注目/ 5段階
深度40%
3
関連度30%
4
実用性20%
2
革新性10%
4

キーポイント

1

次世代原子炉設計の課題

SMRやGen IV設計の実現には安全性と経済性が必須だが、物理実験の高コストと時間制約がイノベーションの足かせとなっている。

2

AI活用型デジタルツインの構築

高忠実度シミュレーションデータを基にAIサロゲートモデルを訓練し、リアルタイムで設計・最適化・安全性評価を行うデジタルツインを実現する。

3

NVIDIAフルスタックソリューション

CUDA-X、PhysicsNeMo、Omniverseを活用し、データ生成からモデル推論・デプロイに至るモジュール型ワークフローを提供する。

4

PhysicsNeMoのモジュール型アーキテクチャ

物理法則を考慮したニューラル演算子や分散学習基盤を活用し、高忠実度のサロゲートモデルを効率的に構築・トレーニングできる。

5

PyTorchとの統合とCAE分野への適用

既存の深層学習ツールを拡張し、流体力学から電磁気学まで多様なCAE問題に対応した参考パイプラインを提供する。

6

FNOを用いた中性子束予測の実装フロー

材料配置と富化率を4チャンネル入力とし、対数空間で中性子束と吸収断面積をjointly予測するFNOの学習・推論手順が具体的に解説されている。

影響分析・編集コメントを表示

影響分析

本記事は、科学計算分野におけるAIの役割を「数値シミュレーションの補完」から「リアルタイム設計・最適化の中核」へと転換させる重要な示唆を示している。特に原子力のような高リスク・高コスト分野において、AI物理モデルが実証プロセスを加速させることで、クリーンエネルギー技術の実用化ロードマップが具体化する可能性が高い。

編集コメント

ベンダーブログ特有の宣伝色が強いものの、科学計算と物理情報モデルの融合というトレンドを明確に可視化しており、業界標準となるフレームワークの選定基準として参考になる。

社会的に受け入れられる原子炉の開発には、安全性、クリーンさ、効率性、経済性、持続可能性が必須となります。これらの要件を満たすには新たなアプローチが必要であり、小型モジュール型原子炉(Small Modular Reactors, SMRs)および第4世代設計(Generation IV designs)への関心が高まりつつあります。

SMRsは設計の標準化と建設を管理された製造環境へ移行させることでプロジェクトの経済性を向上させることを目指し、Gen IV原子炉はトランスウラニウム元素(transuranics)の管理を改善し、廃棄物の放射毒性と半減期(longevity)を低減させることで、根本的な燃料サイクルの課題にアプローチします。これら2つのアプローチを組み合わせることで、より安全でクリーンかつ持続可能な原子力エネルギーへの確実なロードマップが提示されます。

しかし、新設計の検証には大きな課題が伴います。物理実験の高コスト、時間制約、そして本質的な複雑さのため、数値シミュレーション(numerical simulations)は原子炉設計において不可欠です。一方で、これらのシミュレーションの高い計算コストは設計プロセスにおける主要なボトルネックとなり、革新のペースを遅らせることがよくあります。

これに対処するため、原子力エンジニアはデジタルツイン(digital twins)の開発を進めており、これにより大規模な原型機に要するコストと時間の桁違いに少ない費用で、複雑な原子炉システムや燃料サイクルのシミュレーション、テスト、最適化が可能になります。NVIDIA CUDA-X libraries、PhysicsNeMo AI Physics framework、Omniverse librariesは、リアルタイムのデジタルツイン向けにGPU加速型(GPU-accelerated)・AI拡張型(AI-augmented)シミュレーションソリューションを提供することで、原子力業界の開発者がこれらの課題に対処するのを支援します。これらの機能により、エンジニアは革新的な設計を探求し、安全性を厳密に評価し、よりクリーンで効率的な原子力技術への移行を加速させることができます。

AI拡張型(AI-augmented)原子炉シミュレーションおよび設計

このセクションでは、AIサロゲートモデル(AI surrogate models)の高速性を活用した原子炉インタラクティブデジタルツインを構築するためのモジュール型レファレンスワークフローを概説します。インタラクティブデジタルツインの構築にはフルスタックアプローチ(full-stack approach)が必要であり、以下のレファレンスワークフローは各段階でNVIDIA accelerated computing stackの要素を活用しています。

データ生成:高忠実度(high-fidelity)原子炉/マルチフィジックスシミュレーション(multiphysics simulations)(理想的にはGPU加速型)を実行し、トレーニングデータを作成します。

データ前処理:PhysicsNeMo Curatorを使用して、幾何学データと物理場をGPU対応のトレーニングデータセットにキュレート/変換します。

モデル学習:PhysicsNeMoを使用して、複数のGPU上でサロゲートモデルを学習させます。

推論とデプロイメント:APIを介してサロゲートモデルを提供し、インタラクティブデジタルツインへの統合を可能にします。

下流ワークフロー:サロゲートモデルを設計のダウンストリームタスク(例えば、最適化や不確定性定量化(uncertainty quantification)ワークフロー)で活用します。

上記のワークフローは重要な背景情報を提供しますが、このガイドの後半では主にモデル訓練段階と、反応炉物理学を重視した全空間場を予測するサロゲートモデル(surrogate model)の必要性に焦点を当てます。同じワークフローは、CFDおよび構造解析など、原子炉設計において重要な他の分野にも容易に適用できます。

燃料ピンセル(fuel pin cell)のAIサロゲートモデルの構築

燃料ピンセル(fuel pin cell)(または単にピンセル)は、原子炉核心部(nuclear reactor core)のモデル化およびシミュレーションにおいて採用される基本的な反復単位です(以下の図1参照)。

図1. 完全な原子炉核心部、代表的な燃料アセンブリ(fuel assembly)および単一のピンセル

標準的なピンセルは、燃料ペレット(通常は二酸化ウラン)、機械的・化学的保護を提供する被覆層(cladding layer)および周囲の減速材(moderator)で構成されます(以下の図2参照)。これは、その後のアセンブリレベルおよび全核心部解析に先立ち、局所的な中性子輸送(neutron transport)およびフラックス分布(flux distribution)を解明するための、簡略化されつつも物理的に代表性のあるモデルを提供します。

図2. 代表的なピンセルおよびモデルのパラメータ化に使用される主要寸法

典型的な原子炉核心部には約5万本の燃料ピンが含まれており、明示的なピンセル解像度での全核心部シミュレーションは計算上現実的ではありません。そのため、反応炉解析では、微細スケールの輸送物理学を有効パラメータ(特に均質化された断面積(homogenised cross-sections))に凝縮し、反応率を維持しながら粗いメッシュの核心部シミュレータ(coarse-mesh core simulators)で利用するマルチスケール手法(multi-scale methods)に依存しています。

マルチスケール反応炉解析において、正確な核心部シミュレーションは、全核心部シミュレータの粗いメッシュ要素内で反応率を維持する均質化された断面積(homogenised cross-sections)、 、の生成に依存します。これはフラックス重み付け平均法(flux-weighted averaging)によって計算されます:

ここで、 は局所材料組成および中性子エネルギースペクトルに依存する空間的な巨視的断面積分布(macroscopic cross-section distribution)を表し、 は中性子フラックス分布(neutron flux distribution)を表し、空間重み付け関数として機能します。

標準的な体積重み付け平均法(volume-weighted averaging)は、空間自己遮蔽(spatial self-shielding)を無視するため不十分です。これは中性子密度が高吸収性燃料領域内で抑制される現象を指します。そのため、正しい を決定するには、正確な中性子フラックス場(neutron flux field)および巨視的断面積場(macroscopic cross-section field)に関する知識の両方が必要です。

従来、 および を取得するには、高精度モンテカルロ法(Monte Carlo methods)を用いて中性子輸送方程式(neutron transport equation)を解く必要がありました。このプロセスは計算コストが高く、設計空間の深い探索を妨げます。私たちは、幾何形状および燃料濃度(fuel enrichment)から直接 および を同時に予測するサロゲートモデルを訓練することで、高コストな輸送方程式の求解を回避します。

空間的に分解されたフラックス(中性子束)および断面積場を併せて予測し、これらの予測場から均質化された断面積(homogenized cross-section)を計算することにより、標準的な回帰モデルがスカラー入力から直接均質化された断面積をマッピングするものよりも、大幅に高い精度が達成されることを実証します。この物理法則に準拠したアプローチは、重要な空間効果(特に自己遮蔽:self-shielding)を捉えるため、大幅に優れた汎化性能(generalizability)をもたらします。

データセットの生成およびベースラインの特徴量ベース回帰モデルとサロゲートモデル(surrogate model)の学習に使用されたすべてのコードは、こちらから入手可能です。

データセットの生成:効率的なサンプリング

効率的なデータセットを構築するため、高速化ソルバー(accelerated solvers)とスマートサンプリング手法を組み合わせています。

第一段階は、代表的なピンセル(pin cell)のパラメータ化です(上記の図2を参照)。燃料濃度(wt% fissile content:重量パーセントの核分裂性物質含有量)および主要な幾何学的入力(p:ピンピッチ、rf:燃料棒半径、rg:ギャップ半径、rc:被覆管半径)を変化させます。出力は中性子束場(neutron flux field)および空間的に分解された吸収断面積マップです。

正確なサロゲートモデルを学習するために必要なサンプル数(計算コストの高いシミュレーション)を最小限に抑えるため、ラテンハイパーキューブサンプリング(Latin Hypercube Sampling, LHS)を採用しています。LHSにより、サンプルが設計空間を十分にカバーしつつ冗長性が最小限に抑えられます。効率的なサンプリング手法と高速化ソルバーを組み合わせることで、実用的な時間枠内に適切なデータセットを生成できます。

以下の図3は、臨界未満(subcritical)および臨界超過(supercritical)の構成における中性子束場を示しています。炉が臨界未満の場合、有効増倍率(effective multiplication factor, keff)—ある世代の中性子数と前世代の中性子数の比—は1未満であり、連鎖反応は自己維持されません。炉が臨界超過の場合、keff > 1となり、中性子数が増加します。広範囲ではあるが現実的な範囲で濃度と幾何学をサンプリングすることにより、データセットは自然に両方の領域を含み、サロゲートモデルが臨界未満および臨界超過の条件に関連するフラックス場(中性子束場)に曝露されるようになっています。

図3. 臨界未満および臨界超過の構成における中性子束場

PhysicsNeMoを用いたモデル学習

NVIDIA PhysicsNeMoは、複雑な数値シミュレーションをエミュレートするAIサロゲートモデルの構築、学習、ファインチューニングのためのオープンソースPythonフレームワークです。AI物理計算ワークロードのために特別に設計されており、開発者が基盤となるAIソフトウェアスタックではなく、ドメイン固有のAI拡張アプリケーションの構築に集中できるようにします。

重要なのは、PhysicsNeMoがスカラー量だけでなく、空間的に分解された場(例えば圧力、温度、中性子束)を予測するサロゲートモデルを開発するためのモデルアーキテクチャとトレーニングパイプラインを提供している点です。

汎用の機械学習ライブラリとは異なり、PhysicsNeMoはニューラル演算子(neural operators)やグラフニューラルネットワーク(graph neural networks)、ディフュージョンおよびトランスフォーマーベースモデル(diffusion and transformer-based models)など、モジュール化された物理認識型コンポーネントを提供します。これらは最先端のアーキテクチャを用いて、複雑で連続的な物理現象を捉えるように設計されています。これらのアーキテクチャを最適化されたデータパイプラインと分散学習ユーティリティと統合することで、本フレームワークは研究者やエンジニアがマルチGPUおよびマルチノードプラットフォーム(multi-GPU and multi-node platforms)上で高忠実度の代理モデル(surrogate models)を効率的に学習することを可能にし、ゼロからカスタムソリューションを構築する場合と比較して、開発時間と計算オーバーヘッドの両方を大幅に削減します。

さらに、PhysicsNeMoはPyTorchとシームレスに統合されるため、ドメインの専門家は慣れ親しんだディープラーニングツールを活用しつつ、計算支援工学(Computer Aided Engineering, CAE)の問題に特化した機能で拡張することができます。また、本フレームワークには乱流流体力学(turbulent fluid dynamics)から電磁気学(electromagnetics)に至るまで異なるドメイン向けの厳選された例と参照パイプラインが含まれており、新しいアプリケーションの開発を容易に開始できます。

PhysicsNeMoが提供するスケーラビリティ、拡張性、最適化されたパフォーマンスの組み合わせにより、忠実度を犠牲にすることなくニアリアルタイムの予測を提供する代理モデルの開発が可能になります。

フーリエニューラル演算子の学習

このガイドでは、PhysicsNeMoを使用してフーリエニューラル演算子(Fourier Neural Operator, FNO)を学習します。FNOは、中性子束分布(neutron flux distributions)の予測タスクに非常に適しています。なぜなら、束フィールドは材料領域内で比較的に滑らかな空間変動を示すためです。

FNOはスペクトル領域(spectral domain)においてフィールド間演算子を学習します。ここで、切り捨てられた低周波フーリエモードのセットは滑らかな解のコンパクトな表現を提供し、自然にグローバル受容野(global receptive field)を生成します。これにより、モデルは長距離の空間結合を捉えることができ、局所畳み込みの深いスタックと比較して計算オーバーヘッドを大幅に削減します。

入力形式:燃料、被覆材、減速材はワンホットエンコーディング(one-hot encoding)により3つのバイナリマスクチャネルとして符号化されます。燃料の濃度はドメイン全体にブロードキャストされるスカラー値であり、4番目のチャネルとして追加されます。以下の図4を参照してください:

図4. 燃料、被覆材、減速材を表すブーリアンマスク

  1. プリプロセス:ターゲットデータ(中性子束と巨視的吸収断面積)は、大きな動的範囲を処理するためにログ空間(log-space)で正規化されます。3. 学習:

FNOへの入力は、4チャネルテンソル(B, 4, H, W)です。

各ピクセルは、(燃料、被覆材、減速材、濃度)という4次元特徴ベクトルです。

モデルは、中性子束フィールドと吸収断面積フィールドを同時に予測し、正規化されたログ空間における2チャネル出力テンソル(B, 2, H, W)として出力します。学習は、正規化されたターゲットに対する平均二乗誤差(MSE)を用いて行われます。

  1. 推論:入力は同じ4チャネル表現です。モデルは正規化されたログ空間の束と吸収断面積フィールドを予測し、その後、物理値を復元するために逆正規化されます。以下の図5を参照してください:

Figure 5. Observed vs predicted neutron flux field

Baseline model results

完全な中性子フラックス場(neutron flux field)の予測がもたらす利点を示すため、まずベースラインを確立します。それは特徴量ベースの回帰モデル(feature-based regression model)、具体的には勾配ブースティング回帰器(gradient boosting regressor)です。このベースラインモデルは、ピンセル(pin cell)の主要な幾何学的特徴と材料パラメータを捉えた一連のスカラー記述子(scalar descriptors)から、スカラー均質化断面積(scalar homogenised cross-section)を直接予測します。上記の図2を参照してください。ベースライン勾配ブースティング回帰器モデルを用いて得られた結果を図6に示します。ベースラインモデルは、R2スコアが0.80と、合理的に良好な予測精度を示しています。しかし、入力表現がピンセルの幾何学を少数のスカラー値に圧縮しているため、中性子フラックス場、ひいては均質化断面積を定義する完全な空間効果を捉えることができません。

Figure 6. Gradient Boosting Regressor: Observed vs Predicted homogenised cross-section. R2 = 0.80

ベースラインモデルを大幅に改善するために、物理法則に沿った2段階のアプローチ(physics-aligned approach)を採用します。これは、マルチ出力FNO(Fourier Neural Operator)を用いて中性子フラックス場と吸収断面積場を同時に予測し、その後これらの予測値から均質化断面積を計算する手法です。図5は代表的なピンセルの予測フラックス場を示しています。この物理法則に沿ったアプローチは予測精度を大幅に向上させ、R2スコア0.97を達成します(以下の図7を参照)。

Figure 7. FNO: Observed vs Predicted homogenised cross-section. R2 = 0.97

これらの結果は、非単射特徴表現(non-injective feature representation)の例を示しています。これは、複数の異なるピンセルが類似したスカラー記述子を持つ一方で明確に異なる出力を生み出し、特徴量ベースの回帰モデルが学習できる内容を制限する現象です。

2段階の物理法則に沿ったアプローチは、これらのケースを区別するために必要な情報を保持し、より良い汎化性能を発揮します。工学および科学の各分野において、スカラー値に圧縮するのではなく空間情報を保持することが、大幅に優れた汎化性能につながる問題は数多く存在します。

Integrating AI surrogates

このガイドは、原子力業界の開発者およびエンジニア向けに、PhysicsNeMoを用いてAIサロゲートモデル(AI surrogates)を構築し、設計プロセスに統合するための実用的なワークフローを提供します。

当稿では、比較的単純なピンセルの例に焦点を当てています。この例では、中性子フラックス場と吸収断面積場を同時に予測し(その後均質化断面積を計算する)ことが、一連のスカラー記述子から均質化断面積を直接予測するよりも大幅に高い精度をもたらすことを示しています。

スカラー記述子を均質化断面積に直接マッピングする特徴量ベースの回帰モデルは、非単射特徴表現という問題を抱えています。異なる幾何形状が類似したスカラー要約を共有しながら、意味のある違いを持つフラックス分布を生み出し、ひいては異なるフラックス重み付き均質化値をもたらすことがあるためです。

一方、FNO(Fourier Neural Operator)は、幾何学・材料フィールドからフラックス場および吸収断面積(absorption cross-section)フィールドへの演算子マッピングを学習し、実際にフラックス重み付けを決定する空間情報を保持します。その後、予測されたフィールドから均質化断面積(homogenised cross-section)を計算することで、物理ベースの集約処理が正しく適用され、予測精度と汎化性能が大幅に向上します。

さらに先へ

NVIDIA PhysicsNeMoは、産業規模のサロゲートモデル(surrogate model)のトレーニングプロセスを大幅に簡素化し、分散トレーニング(distributed training:データ並列(data parallel)およびドメイン並列(domain parallel))の実装を簡略化する、最適化されたモデルアーキテクチャとユーティリティのコレクションを提供します。

大規模なモデルのトレーニングに関する詳細を抽象化するPhysicsNeMoにより、開発者やエンジニアは結果に集中でき、高速なサロゲートモデリングを提供することで設計探索の時間と計算コストを劇的に削減できます。さらに、開発者はNVIDIA Omniverseライブラリを活用してリアルタイムのデジタルツイン(digital twins)を作成することも可能です。

本ガイドが、ドメインエキスパートにとって設計ワークフローでPhysicsNeMoを活用する動機付けとなり、このアプローチを原子力業界において最も計算コストの高い問題へと拡張していくきっかけとなることを願っています。

はじめに

SciML開発者やAI Physicsの実践者が、PhysicsNeMoを武器庫の強力なツールとして活用し、PyTorchスタック(PyTorch stack)を強化・拡張することができます。すべてを一から構築する代わりに、PhysicsNeMoモジュールをインポートすることで、かつてない速度と簡便さでAI Physicsサロゲートを開発できます。以下のリソースを用いて、簡単かつ段階的に始められます:

燃料ピンセルサロゲート構築におけるPhysicsNeMoの活用

PhysicsNeMo 始め方ガイド

PhysicsNeMo リファレンスサンプル

原文を表示

The development of socially acceptable nuclear reactors requires that they are safe, clean, efficient, economical, and sustainable. Meeting these requirements calls for new approaches, driving growing interest in Small Modular Reactors (SMRs) and in Generation IV designs.

SMRs aim to improve project economics by standardising designs and shifting construction to controlled manufacturing environments, while Gen IV reactors target fundamental fuel-cycle challenges by better managing transuranics and reducing the radiotoxicity and longevity of waste. Together, these approaches offer a credible roadmap toward safer, cleaner, and more sustainable nuclear energy.

However, validating new designs presents significant challenges. Due to the expense, time constraints, and inherent complexities of physical experiments, numerical simulations are fundamental to the design of nuclear reactors. Yet, the high computational cost of these simulations often creates a major bottleneck in the design process, slowing the pace of innovation.

To address this, nuclear engineers are developing digital twins that enable the simulation, testing, and optimization of complex reactor systems and fuel cycles at a fraction of the cost and time required for full-scale prototypes. NVIDIA CUDA-X libraries, the PhysicsNeMo AI Physics framework, and the Omniverse libraries help developers in the nuclear industry address these challenges by delivering GPU-accelerated, AI-augmented simulation solutions for real-time digital twins. These capabilities enable engineers to explore innovative designs, rigorously assess safety, and accelerate the transition toward cleaner and more efficient nuclear technologies.

AI-augmented nuclear reactor simulation and design

This section outlines a modular reference workflow for building interactive digital twins of nuclear reactors that leverage the speed of AI surrogate models. Building interactive digital twins requires a full-stack approach, and the reference workflow below utilises elements of the NVIDIA accelerated computing stack at every stage.

Data generation: Run high-fidelity reactor/multiphysics simulations (ideally GPU-accelerated) to produce training data.

Data preprocessing: Use PhysicsNeMo Curator to curate/transform geometry and fields into GPU-ready training datasets.

Model training: Use PhysicsNeMo to train surrogate models on multiple GPUs.

Inference & deployment: Serve the surrogate model via an API to enable integration into interactive digital twins.

Downstream workflows: Employ the surrogate model in downstream design tasks (for example, optimisation and uncertainty quantification workflows).

While the workflow above provides important context, the remainder of this guide focuses primarily on the model training stage and the need for surrogate models that predict full spatial fields, with an emphasis on reactor physics. The same workflow can be easily adapted to other domains that are important in the design of a nuclear reactor, such as CFD and structural analysis.

Building an AI surrogate model of a fuel pin cell

A fuel pin cell (or simply a pin cell) is the fundamental repeating unit employed in the modelling and simulation of a nuclear reactor core (see Figure 1, below).

Figure 1. The full reactor core, a representative fuel assembly and a single pin cell

A standard pin cell comprises a fuel pellet (typically uranium dioxide), a cladding layer providing mechanical and chemical protection, and the surrounding moderator (see Figure 2, below). It provides a simplified yet physically representative model for resolving local neutron transport and flux distributions prior to subsequent assembly-level and full-core analyses.

Figure 2. A representative pin cell and the key dimensions used to parameterise the model

A typical reactor core contains on the order of 50,000 fuel pins, making full-core simulation at explicit pin cell resolution computationally impracticable. Consequently, reactor analysis relies on multi-scale methods in which fine-scale transport physics is condensed into effective parameters (notably homogenised cross-sections) that are utilized in coarse-mesh core simulators while preserving reaction rates.

In multi-scale reactor analysis, accurate core simulation depends on the generation of homogenised cross-sections, , that preserve reaction rates within the coarse-mesh elements of full-core simulators. This is calculated via flux-weighted averaging:

where represents the spatial macroscopic cross-section distribution, which depends on the local material composition and neutron energy spectrum, and represents the neutron flux distribution, which acts as the spatial weighting function.

Standard volume-weighted averaging is insufficient because it neglects spatial self-shielding – the phenomenon where the neutron population is depressed within highly absorbing fuel regions. Consequently, determining the correct requires knowledge of both the precise neutron flux field and the macroscopic cross-section field .

Conventionally, obtaining and requires solving the neutron transport equation using high-fidelity Monte Carlo methods. This process is computationally expensive and prohibits deep design space exploration. We bypass the expensive transport solve by training a surrogate model to jointly predict and directly from the geometry and fuel enrichment.

We demonstrate that by jointly predicting the spatially resolved flux and cross-section fields, and then computing the homogenised cross-section from these predicted fields, substantially higher accuracy is achieved than with standard regression models that map a set of scalar inputs directly to the homogenised cross-section. This physics-aligned approach captures important spatial effects—notably self-shielding—resulting in much better generalisability.

All code used to generate the dataset and train the baseline feature-based regression model and the surrogate model is available here.

Dataset generation: Efficient sampling

To build a dataset efficiently, we combine accelerated solvers with smart sampling techniques.

The first step is to parameterise a representative pin cell (see Figure 2, above). We vary the fuel enrichment (wt% fissile content) and key geometric inputs: p (pin pitch), rf (fuel rod radius), rg (gap radius) and rc (cladding radius). The outputs are the neutron flux field and the spatially resolved absorption cross-section map.

To minimize the number of samples (computationally expensive simulations) required to train an accurate surrogate model, we employ Latin Hypercube Sampling (LHS). LHS ensures that the samples provide good coverage of the design space while minimising redundancy. By combining efficient sampling techniques with accelerated solvers, a suitable dataset can be generated in practical timeframes.

Figure 3, below, illustrates the neutron flux field in a subcritical and a supercritical configuration. When a reactor is subcritical, the effective multiplication factor keff —the ratio of neutrons in one generation to the previous—is less than 1, and the chain reaction isn’t self-sustaining. When a reactor is supercritical, keff > 1, the neutron population increases. By sampling enrichment and geometry across a wide but realistic range, the dataset naturally includes both regimes, providing the surrogate exposure to flux fields associated with subcritical and supercritical conditions.

Figure 3. Neutron flux field in a subcritical and supercritical configuration

Model training with PhysicsNeMo

NVIDIA PhysicsNeMo is an open-source Python framework for building, training, and fine-tuning AI surrogate models that emulate complex numerical simulations. It is purpose-built for AI physics workloads and enables developers to focus on building domain specific AI-augmented applications rather than the underlying AI software stack.

Importantly, PhysicsNeMo provides model architectures and training pipelines for developing surrogate models that predict spatially resolved fields (for example, pressure, temperature, neutron flux), rather than only scalar quantities.

Unlike general-purpose machine learning libraries, PhysicsNeMo provides modular, physics-aware components—from neural operators and graph neural networks to diffusion and transformer-based models—that are designed to capture complex, continuous physical phenomena using state-of-the-art architectures. By integrating these architectures with optimized data pipelines and distributed training utilities, the framework enables researchers and engineers to train high-fidelity surrogate models efficiently on multi-GPU and multi-node platforms, significantly reducing both development time and computational overhead compared with building custom solutions from scratch.

Moreover, PhysicsNeMo integrates seamlessly with PyTorch, so domain experts can leverage familiar deep learning tools while extending them with capabilities tailored to Computer Aided Engineering (CAE) problems. The framework also includes curated examples and reference pipelines for different domains, from turbulent fluid dynamics to electromagnetics, making it easy to start developing new applications.

The combination of scalability, extensibility, and optimized performance provided by PhysicsNeMo enables the development of surrogate models that deliver near real-time predictions without sacrificing fidelity.

Training Fourier Neural Operators

In this guide, we train a Fourier Neural Operator (FNO) using PhysicsNeMo. FNOs are well-suited to the task of predicting neutron flux distributions because the flux field exhibits relatively smooth spatial variations within material regions.

FNOs learn a field-to-field operator in the spectral domain, where a truncated set of low-frequency Fourier modes provides a compact representation of smooth solutions and naturally yields a global receptive field. This allows the model to capture long-range spatial coupling, significantly reducing the computational overhead compared to deep stacks of local convolutions.

Input format: Fuel, cladding, and moderator are encoded as three binary mask channels via one-hot encoding. Fuel enrichment is a scalar value broadcast over the domain and appended as a fourth channel. See Figure 4, below:

Figure 4. Boolean mask representing the fuel, cladding and moderator

  1. Preprocessing: Target data (neutron flux and macroscopic absorption cross-section) is normalised in log-space to handle the large dynamic range.3. Training:

The input to the FNO is a 4-channel tensor (B, 4, H, W)

Each pixel is a 4D feature vector: (fuel, cladding, moderator, enrichment).

The model jointly predicts the neutron flux field and the absorption cross-section field as a 2-channel output tensor (B, 2, H, W) in normalised log-space and is trained with MSE against the normalised target.

  1. Inference: Input is the same 4-channel representation. The model predicts normalised log-space flux and absorption cross-section fields, which are then denormalised to recover physical values. See Figure 5, below:

Figure 5. Observed vs predicted neutron flux field

Baseline model results

To demonstrate the advantages of predicting the full neutron flux field, we first establish a baseline: a feature-based regression model—specifically, a gradient boosting regressor. The baseline model directly predicts the scalar homogenised cross-section from a set of scalar descriptors capturing the key geometric features and material parameters of a pin cell (see Figure 2, above).Results obtained using the baseline gradient boosting regressor model are illustrated in Figure 6, below. The baseline model demonstrates reasonably good predictive accuracy, with an R2 score of 0.80. However, because the input representation compresses the pin cell geometry into a small set of scalars, it does not capture the full spatial effects that define the neutron flux and, consequently, the homogenised cross-section.

Figure 6. Gradient Boosting Regressor: Observed vs Predicted homogenised cross-section. R2 = 0.80

We can significantly improve upon the baseline model by employing a two-step physics-aligned approach: jointly predict the neutron flux field and the absorption cross-section field using a multi-output FNO, then compute the homogenised cross-section from these predicted values. Fig. 5 illustrates the predicted flux field for a representative pin cell. This physics-aligned approach significantly improves predictive accuracy, achieving an R2 score of 0.97 (see Figure 7, below).

Figure 7. FNO: Observed vs Predicted homogenised cross-section. R2 = 0.97

These results demonstrate an example of non-injective feature representation, where multiple distinct pin cells have similar scalar descriptors but distinct outputs, limiting what a feature-based regression model can learn.

The two-step physics-aligned approach preserves the information required to distinguish between these cases and generalises better. Across engineering and scientific domains, there are numerous problems where retaining spatial information, rather than compressing it into scalars, leads to substantially better generalisability.

Integrating AI surrogates

This guide provides a practical workflow for developers and engineers in the nuclear industry to build AI surrogates using PhysicsNeMo and integrate them into their design processes.

We have focused on a relatively simple pin cell example, where jointly predicting the neutron flux field and the absorption cross-section field—and then computing the homogenised cross-section—yields substantially higher accuracy than directly predicting the homogenised cross-section from a set of scalar descriptors.

A feature-based regression model that maps scalar descriptors directly to the homogenised cross-section suffers from a non-injective feature representation: Distinct geometries can share similar scalar summaries while producing meaningfully different flux distributions and hence different flux-weighted homogenised values.

In contrast, an FNO learns the operator mapping from geometry/material fields to both the flux field and the absorption cross-section field, preserving the spatial information that actually determines the flux weighting. Computing the homogenised cross-section from the predicted fields then enforces the correct physics-based aggregation, which substantially improves predictive accuracy and generalisation.

Going further

NVIDIA PhysicsNeMo significantly eases the process of training industry-scale surrogate models, providing a collection of optimized model architectures and utilities that simplify the implementation of distributed training (both data parallel and domain parallel).

By abstracting away the details of training models at scale, PhysicsNeMo enables developers and engineers to focus on outcomes and dramatically reduce the time and computational cost of design exploration by offering fast surrogate modeling. Additionally, developers can leverage NVIDIA Omniverse libraries to create real-time digital twins.

We hope that this guide will serve as motivation for domain experts to utilize PhysicsNeMo in their design workflows, extending this approach to the most computationally demanding problems in the nuclear industry.

Getting started

If you are a SciML developer or an AI Physics AI practitioner, PhysicsNeMo is a powerful tool in your arsenal to supercharge and extend your PyTorch stack. Instead of building everything from scratch, you can import PhysicsNeMo modules to develop AI Physics surrogates with unprecedented speed and simplicity. You can get started easily and step by step using these resources:

Using PhysicsNeMo for building fuel pin cell surrogate

PhysicsNeMo Getting Started Guide

PhysicsNeMo Reference Samples

この記事をシェア

関連記事

NVIDIA Developer Blog★42026年4月17日 00:00

DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法

NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。

AI Business★32026年4月17日 00:45

NVIDIA、チップソフトウェアメーカーと提携しシミュレーションと現実のギャップを縮める

NVIDIAはCadenceとの提携を拡大し、ロボットトレーニングデータの精度向上とエンジニア向けAIサービスの構築を目指す。

The Decoder★42026年4月17日 01:33

NVIDIA、ロボットシミュレーション訓練を拡張するLyra 2.0を発表

NVIDIAの研究者が、単一写真から大規模で一貫性のある3D環境を生成するシステム「Lyra 2.0」を発表した。生成されたシーンはリアルタイムで探索可能で、ロボットシミュレーションに直接使用できる。

ニュース一覧に戻る元記事を読む