NVIDIA Developer Blog の最新記事
公式164件の記事
NVIDIA CUDA 13.3 が C++ のタイルプログラミング、コンパイラ自動調整、Python 更新で GPU 開発を強化
NVIDIA は CUDA 13.3 をリリースし、C++ でのタイルプログラミング機能の追加、コンパイラの自動調整機能、および Python ライブラリの更新を通じて、GPU 開発効率を向上させました。
NVIDIA RTX PRO 4500 Blackwell でゲノム解析とタンパク質折りたたみワークロードを高速化
NVIDIA は、精密医療を実現する基盤として、RTX PRO 4500 Blackwell グラフィックスカードを活用し、ゲノム配列解読や分子レベルの治療法特定にかかる時間を大幅に短縮するプラットフォームを提供している。
大規模な事前学習済みモデルの提供に向けた、現実的な 3D 医療画像の合成
NVIDIA は、データ不足やプライバシー制限という課題を克服し、高品質な 3D 医療画像データを大規模に合成する手法を発表した。これにより、放射線科 AI の基盤となるデータの確保が可能になる。
Kubernetes クラスター全体での GPU 使用状況をリアルタイムで可視化する方法
NVIDIA が、Kubernetes クラスター全体にわたる GPU の使用状況をリアルタイムで監視・可視化する機能を提供するツールを発表しました。
Slurm のトポロジー対応ジョブスケジューリングにより NVIDIA GB200 NVL72 でエクサスケール性能を発揮
NVIDIA は、Slurm のトポロジー対応ジョブスケジューリング機能を活用することで、GB200 NVL72 システムでエクサスケールの計算性能を達成できることを示した。
Telco AI ファクトリー上でトークン課金型 AI サービスを構築する
NVIDIA は、世界中の通信事業者が同社のクラウドパートナー参照アーキテクチャに基づいて主権 AI ファクトリーを構築している現状を紹介し、政府や企業向けにトークン課金型の AI サービスを提供する方法について解説しています。
エージェント技術の習得:AI エージェントのカスタマイズ
NVIDIA は、開発者が AI エージェントを独自にカスタマイズし、複雑なタスクを処理できるようにする手法について解説している。
NVIDIA が検証済みエージェントスキルにより、AI エージェントの能力ガバナンスを提供
NVIDIA は、AI エージェントが実行する機能の信頼性と安全性を確保するため、「NVIDIA-Verified Agent Skills」という仕組みを導入し、能力ガバナンスを実現したと発表した。
エージェント技術の習得:AI エージェントの評価
NVIDIA が、自律型 AI エージェントの性能を測定・評価するための手法や技術を解説している。
NVIDIA の Vera Rubin プラットフォームがアジェンティック AI のスケールアップ問題を解決する方法
NVIDIA は、Vera Rubin プラットフォームによって、自律型 AI(アジェンティック AI)の拡張性を向上させる技術的課題を解決したと発表した。
新素材のナノスケールイメージングのための加速 X 線解析 (XANI)
NVIDIA は、核融合材料や半導体などの新システムにおける構造および電子ダイナミクスを追跡するために、大規模な X 線自由電子レーザー (XFEL) を活用した加速 X 線解析技術を開発しました。
AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換
NVIDIA は、AI エージェントとスキル機能を用いて、組織が動画からリアルタイムで意味のある洞察を抽出し、それを即座に検索・活用できる技術を発表した。
AI モデル推論パイプラインの摩擦を解消する方法
NVIDIA は、訓練済み AI モデルを実環境へ展開する際のボトルネック解消法を提示し、モデルのエクスポートや最適化プロセスにおける課題解決策を解説している。
リアルタイムの GPU ファーム可視化と最適化を可能にする「NVIDIA Fleet Intelligence」の発表
NVIDIA は、GPU ファームのリソース使用状況をリアルタイムで可視化し、効率を最適化する新ツール「Fleet Intelligence」を発表した。これにより、大規模な AI 基盤の運用管理が強化される。
文法制約付きデコーディングによる小型言語モデルの Bash 生成能力向上
NVIDIA は、小型言語モデルが Bash コマンドをより正確に生成できるよう、文法制約付きデコーディング手法を導入したと発表した。これにより、AI エージェントのシステム操作精度が向上する。
Slurm ブロックスケジューリングによる NVIDIA GB200 NVL72 のシステム・ワークロード効率最大化
NVIDIA が提供する大規模 AI クラスタ「GB200 NVL72」において、Slurm 管理システムにブロックスケジューリングを導入することで、ハードウェアの性能を最大限引き出し、計算リソースの効率的な運用を実現する手法について解説している。
NVIDIA モデルオプティマイザーを用いたポストトレーニング量子化:モデル量子化の手法
NVIDIA は、同社のモデルオプティマイザーツールを使用して、学習済みモデルを効率的に量子化する手法を公開した。これにより、AI 推論の速度向上とリソース削減が可能となる。
NCCL Inspector と Prometheus を用いたリアルタイムパフォーマンス監視と高速デバッグ
NVIDIA は、分散深層学習の GPU 間通信を最適化する「NCCL Inspector」と「Prometheus」を組み合わせたツールを発表し、トレーニング時の遅延問題を迅速に特定・解決する手法を提供した。
エージェンシーシステムの複雑化に対応する極限の共設計
研究者らが、エージェンシーシステムの複雑さが増大する中で、ハードウェアとソフトウェアを統合的に最適化する「極限の共設計」手法を提案し、システム性能向上を目指す。
NVIDIA の cuOpt エージェントスキルを活用したサプライチェーン意思決定システムの最適化
NVIDIA は、cuOpt エージェントスキルを導入することで、サプライチェーンの意思決定システムを最適化する手法を発表しました。これにより、物流効率やコスト削減が期待されます。
NVIDIA DLSS 4.5、RTX、Unreal Engine 5 を活用した AI パワーゲームの構築
NVIDIA は、DLSS 4.5 と RTX グラフィックスカード、および Unreal Engine 5 を組み合わせることで、AI を駆使した高品質なゲーム開発を可能にする技術を提供している。
NVIDIA TensorRT を用いた RTX ランタイムでの Unreal Engine NNE インフレンス高速化
NVIDIA は、Unreal Engine のニューラルネットワーク推論を RTX ランタイム上で NVIDIA TensorRT を活用して高速化する技術を発表した。これにより、リアルタイムアプリケーションの処理速度が向上する。
AI エージェントによる GPU カーネル変換の自動化:cuTile Python から cuTile.jl へ
NVIDIA は、AI エージェントを活用して CUDA Tile(cuTile)のプログラミングモデルを拡張し、Python で記述されたカーネルを Julia の cuTile.jl 形式へ自動的に変換する手法を発表した。これにより、開発者は異なる言語間での GPU 最適化コードの移行が容易になる。
24/7 シミュレーションループ:エージェント型 AI が地下資源工学を推進する方法
NVIDIA は、地下資源業界のデジタル進化において、専門家の作業を支援する 24 時間稼働型のシミュレーションループを実現するエージェント型 AI の重要性について解説している。
NVIDIA BlackwellとGPUアクセラレーションエンドポイントを用いたDeepSeek V4の構築
DeepSeekは第4世代フラッグシップモデル「V4-Pro/Flash」を公開し、NVIDIA BlackwellとGPUアクセラレーションエンドポイントを活用した構築環境を提供した。
NVIDIA FLARを用いたリファクタリング負担軽減の連合学習
NVIDIAはFLARツールを用いることで、医療機関などがデータ移動の制約下でも既存コードを改修せず連合学習を実践的に運用可能だと説明している。
生成AI支援コーディングによるKaggleコンペ優勝
2026年3月、3つのLLMエージェントが60万行以上のコードを生成し850回の実験を実行して、Kaggleプレイグラウンドコンペティションで優勝を勝ち取った。
nvmath-pythonにおけるユニバーサルスパーステンソルによるスパース深層学習の簡素化
NVIDIAはnvmath-pythonライブラリにユニバーサルスパーステンソル(UST)を実装し、開発者がテンソルのスパース性とメモリ配置を分離できるようにした。
NVIDIA RTX PRO 4500 Blackwell Server EditionとvGPU 20でAI対応データセンターを拡張する
NVIDIAはRTX PRO 4500 Blackwell Server EditionとvGPU 20を提供し、Officeや設計ツールなどへのAI統合を支援する。
NVIDIA MegatronによるLLM学習高速化へ向けた新世代オプティマイザの高度化
NVIDIAは、ニューラルネットワーク学習で実績のある高次最適化アルゴリズム「Shampoo」などをNVIDIA Megatronで高度化し、大規模言語モデル(LLM)の学習速度を大幅に向上させる技術を開発した。
NVIDIA Jetson上で大規模モデルを動作させるためのメモリ効率最適化
NVIDIAはJetsonプラットフォーム上で大規模生成AIモデルを動作させるため、メモリ効率を最適化する技術を提供し、開発者のエッジデプロイメントを支援している。
エンドツーエンドFP8精度による高スループット強化学習トレーニングの実行
NVIDIAは、大規模言語モデルの複雑な推論支援のため、エンドツーエンドFP8精度を活用した高スループット強化学習トレーニング手法を提供する。
エージェント環境における間接AGENTS.mdインジェクション攻撃の対策
AI開発ツールの普及に伴い、NVIDIAはAGENTS.mdファイルを用いた間接インジェクション攻撃への対策手法を提示している。
NVIDIA Dynamoによるエージェント推論のフルスタック最適化
NVIDIAがDynamoを発表し、エージェント推論のフルスタック最適化を提供。Stripeのエージェントは週1300以上のPRを生成、RampはマージPRの30%をエージェントに帰属。
OpenClawとNVIDIA NemoClawで安全な常時稼働型ローカルAIエージェントを構築
NVIDIAは、OpenClawとNemoClawを使用して、ファイル読み込みやAPI呼び出しが可能な常時稼働型の自律AIエージェントをローカル環境で安全に構築する方法を紹介している。
AI物理学でクリーンでモジュール式の原子炉設計を加速
NVIDIAは、安全でクリーンな原子炉開発のためにAI物理学を活用し、設計プロセスを加速する取り組みを進めている。
DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法
NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。
NVIDIA ALCHEMIツールキットによる化学・材料科学のためのカスタム原子シミュレーションワークフローの構築
NVIDIAは、ALCHEMIツールキットを発表した。このツールキットは、密度汎関数理論などの高精度手法と機械学習を組み合わせ、化学・材料科学分野の原子シミュレーションのワークフローを効率化する。
NVIDIA NVbandwidth:GPU相互接続とメモリ性能を測定する必須ツール
NVIDIAが、CUDAアプリケーション開発時に重要なデータ転送性能を測定するツール「NVbandwidth」を公開した。このツールはGPU間の相互接続とメモリ性能を評価するために設計されている。
NVIDIA Ising、フォールトトレラント量子システム構築のためのAI駆動ワークフローを導入
NVIDIAがIsingを発表した。これは量子プロセッサ構築のための世界初のオープンAIモデルファミリーで、Ising CalibrationとIsing...の2つのモデルドメインを備えている。
MiniMax M2.7、複雑なAIアプリケーション向けにNVIDIAプラットフォーム上でスケーラブルなエージェントワークフローを進化させる
MiniMax社がM2.7をリリースし、エージェントハーネス向けに設計されたM2.5モデルを強化し、NVIDIAプラットフォーム上で複雑なAIアプリケーションのためのスケーラブルなエージェントワークフローを推進した。
Kubernetes上でSlurmを使用した大規模GPUワークロードの実行
NVIDIAが、オープンソースのクラスタ管理システムSlurmをKubernetesと統合し、大規模GPUワークロードを効率的に管理・スケジューリングする方法を紹介している。SlurmはTOP500システムの65%以上で採用されている実績を持つ。
約30行のPythonとNVIDIA nvCOMPでチェックポイントコストを削減
NVIDIAが、LLM学習時のチェックポイント保存コストを削減するPythonスクリプトを公開した。約30行のコードでモデル重み・オプティマイザ状態・勾配の圧縮保存を実現し、ストレージコストとI/O負荷を低減できる。
プロテオーム規模でのタンパク質構造予測を加速する方法
NVIDIAが、タンパク質が単体ではなく相互作用によって生物学的プロセスを制御する点に着目し、プロテオーム規模でのタンパク質構造予測を高速化する手法を提案している。
NVIDIA Omniverseライブラリで既存アプリに物理AI機能を統合
NVIDIAは、物理的に接地されたシミュレーション環境で知覚・推論・行動する物理AIシステムを、既存アプリケーションに統合するOmniverseライブラリを提供している。これにより、ロボットや自動運転車の設計・検証プロセスが変革されている。
ラックスケールスーパーコンピュータでのAIワークロード実行:ハードウェアからトポロジ対応スケジューリングまで
NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。
バッチモードVC-6とNVIDIA NsightによるビジョンAIパイプラインの高速化
NVIDIAが、ビジョンAIシステムのデコード・前処理・GPU処理などのパイプライン全体を高速化するため、バッチモードVC-6とNVIDIA Nsightを活用する方法を紹介した。
資本市場向けに一桁マイクロ秒レベルの推論遅延を実現
NVIDIAが、アルゴリズム取引向けに市場イベントへの応答時間を短縮する技術を開発した。高速電子市場に対応するため、遅延に敏感な企業向けに推論遅延を一桁マイクロ秒レベルに低減するソリューションを提供する。
Gemma 4でAIをエッジおよびオンデバイスに近づける
NVIDIAが最新のマルチモーダル・多言語モデル「Gemma 4」を発表し、クラウドからエッジデバイスまで幅広い展開に対応するモデルを提供した。
CUDAタイルプログラミングがBASICで利用可能に!
NVIDIAがCUDA 13.1でCUDA Tileを導入し、BASIC言語で細粒度並列処理をよりアクセスしやすく柔軟にする次世代タイルベースGPUプログラミングパラダイムを提供した。