NVIDIA Developer Blog の最新記事
公式97件の記事
新素材のナノスケールイメージングのための加速 X 線解析 (XANI)
NVIDIA は、核融合材料や半導体などの新システムにおける構造および電子ダイナミクスを追跡するために、大規模な X 線自由電子レーザー (XFEL) を活用した加速 X 線解析技術を開発しました。
AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換
NVIDIA は、AI エージェントとスキル機能を用いて、組織が動画からリアルタイムで意味のある洞察を抽出し、それを即座に検索・活用できる技術を発表した。
AI モデル推論パイプラインの摩擦を解消する方法
NVIDIA は、訓練済み AI モデルを実環境へ展開する際のボトルネック解消法を提示し、モデルのエクスポートや最適化プロセスにおける課題解決策を解説している。
文法制約付きデコーディングによる小型言語モデルの Bash 生成能力向上
NVIDIA は、小型言語モデルが Bash コマンドをより正確に生成できるよう、文法制約付きデコーディング手法を導入したと発表した。これにより、AI エージェントのシステム操作精度が向上する。
NCCL Inspector と Prometheus を用いたリアルタイムパフォーマンス監視と高速デバッグ
NVIDIA は、分散深層学習の GPU 間通信を最適化する「NCCL Inspector」と「Prometheus」を組み合わせたツールを発表し、トレーニング時の遅延問題を迅速に特定・解決する手法を提供した。
AI エージェントによる GPU カーネル変換の自動化:cuTile Python から cuTile.jl へ
NVIDIA は、AI エージェントを活用して CUDA Tile(cuTile)のプログラミングモデルを拡張し、Python で記述されたカーネルを Julia の cuTile.jl 形式へ自動的に変換する手法を発表した。これにより、開発者は異なる言語間での GPU 最適化コードの移行が容易になる。
24/7 シミュレーションループ:エージェント型 AI が地下資源工学を推進する方法
NVIDIA は、地下資源業界のデジタル進化において、専門家の作業を支援する 24 時間稼働型のシミュレーションループを実現するエージェント型 AI の重要性について解説している。
NVIDIA BlackwellとGPUアクセラレーションエンドポイントを用いたDeepSeek V4の構築
DeepSeekは第4世代フラッグシップモデル「V4-Pro/Flash」を公開し、NVIDIA BlackwellとGPUアクセラレーションエンドポイントを活用した構築環境を提供した。
NVIDIA FLARを用いたリファクタリング負担軽減の連合学習
NVIDIAはFLARツールを用いることで、医療機関などがデータ移動の制約下でも既存コードを改修せず連合学習を実践的に運用可能だと説明している。
生成AI支援コーディングによるKaggleコンペ優勝
2026年3月、3つのLLMエージェントが60万行以上のコードを生成し850回の実験を実行して、Kaggleプレイグラウンドコンペティションで優勝を勝ち取った。
nvmath-pythonにおけるユニバーサルスパーステンソルによるスパース深層学習の簡素化
NVIDIAはnvmath-pythonライブラリにユニバーサルスパーステンソル(UST)を実装し、開発者がテンソルのスパース性とメモリ配置を分離できるようにした。
NVIDIA RTX PRO 4500 Blackwell Server EditionとvGPU 20でAI対応データセンターを拡張する
NVIDIAはRTX PRO 4500 Blackwell Server EditionとvGPU 20を提供し、Officeや設計ツールなどへのAI統合を支援する。
NVIDIA MegatronによるLLM学習高速化へ向けた新世代オプティマイザの高度化
NVIDIAは、ニューラルネットワーク学習で実績のある高次最適化アルゴリズム「Shampoo」などをNVIDIA Megatronで高度化し、大規模言語モデル(LLM)の学習速度を大幅に向上させる技術を開発した。
NVIDIA Jetson上で大規模モデルを動作させるためのメモリ効率最適化
NVIDIAはJetsonプラットフォーム上で大規模生成AIモデルを動作させるため、メモリ効率を最適化する技術を提供し、開発者のエッジデプロイメントを支援している。
エンドツーエンドFP8精度による高スループット強化学習トレーニングの実行
NVIDIAは、大規模言語モデルの複雑な推論支援のため、エンドツーエンドFP8精度を活用した高スループット強化学習トレーニング手法を提供する。
エージェント環境における間接AGENTS.mdインジェクション攻撃の対策
AI開発ツールの普及に伴い、NVIDIAはAGENTS.mdファイルを用いた間接インジェクション攻撃への対策手法を提示している。
NVIDIA Dynamoによるエージェント推論のフルスタック最適化
NVIDIAがDynamoを発表し、エージェント推論のフルスタック最適化を提供。Stripeのエージェントは週1300以上のPRを生成、RampはマージPRの30%をエージェントに帰属。
OpenClawとNVIDIA NemoClawで安全な常時稼働型ローカルAIエージェントを構築
NVIDIAは、OpenClawとNemoClawを使用して、ファイル読み込みやAPI呼び出しが可能な常時稼働型の自律AIエージェントをローカル環境で安全に構築する方法を紹介している。
AI物理学でクリーンでモジュール式の原子炉設計を加速
NVIDIAは、安全でクリーンな原子炉開発のためにAI物理学を活用し、設計プロセスを加速する取り組みを進めている。
DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法
NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。
NVIDIA ALCHEMIツールキットによる化学・材料科学のためのカスタム原子シミュレーションワークフローの構築
NVIDIAは、ALCHEMIツールキットを発表した。このツールキットは、密度汎関数理論などの高精度手法と機械学習を組み合わせ、化学・材料科学分野の原子シミュレーションのワークフローを効率化する。
NVIDIA NVbandwidth:GPU相互接続とメモリ性能を測定する必須ツール
NVIDIAが、CUDAアプリケーション開発時に重要なデータ転送性能を測定するツール「NVbandwidth」を公開した。このツールはGPU間の相互接続とメモリ性能を評価するために設計されている。
NVIDIA Ising、フォールトトレラント量子システム構築のためのAI駆動ワークフローを導入
NVIDIAがIsingを発表した。これは量子プロセッサ構築のための世界初のオープンAIモデルファミリーで、Ising CalibrationとIsing...の2つのモデルドメインを備えている。
MiniMax M2.7、複雑なAIアプリケーション向けにNVIDIAプラットフォーム上でスケーラブルなエージェントワークフローを進化させる
MiniMax社がM2.7をリリースし、エージェントハーネス向けに設計されたM2.5モデルを強化し、NVIDIAプラットフォーム上で複雑なAIアプリケーションのためのスケーラブルなエージェントワークフローを推進した。
Kubernetes上でSlurmを使用した大規模GPUワークロードの実行
NVIDIAが、オープンソースのクラスタ管理システムSlurmをKubernetesと統合し、大規模GPUワークロードを効率的に管理・スケジューリングする方法を紹介している。SlurmはTOP500システムの65%以上で採用されている実績を持つ。
約30行のPythonとNVIDIA nvCOMPでチェックポイントコストを削減
NVIDIAが、LLM学習時のチェックポイント保存コストを削減するPythonスクリプトを公開した。約30行のコードでモデル重み・オプティマイザ状態・勾配の圧縮保存を実現し、ストレージコストとI/O負荷を低減できる。
プロテオーム規模でのタンパク質構造予測を加速する方法
NVIDIAが、タンパク質が単体ではなく相互作用によって生物学的プロセスを制御する点に着目し、プロテオーム規模でのタンパク質構造予測を高速化する手法を提案している。
NVIDIA Omniverseライブラリで既存アプリに物理AI機能を統合
NVIDIAは、物理的に接地されたシミュレーション環境で知覚・推論・行動する物理AIシステムを、既存アプリケーションに統合するOmniverseライブラリを提供している。これにより、ロボットや自動運転車の設計・検証プロセスが変革されている。
ラックスケールスーパーコンピュータでのAIワークロード実行:ハードウェアからトポロジ対応スケジューリングまで
NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。
バッチモードVC-6とNVIDIA NsightによるビジョンAIパイプラインの高速化
NVIDIAが、ビジョンAIシステムのデコード・前処理・GPU処理などのパイプライン全体を高速化するため、バッチモードVC-6とNVIDIA Nsightを活用する方法を紹介した。
資本市場向けに一桁マイクロ秒レベルの推論遅延を実現
NVIDIAが、アルゴリズム取引向けに市場イベントへの応答時間を短縮する技術を開発した。高速電子市場に対応するため、遅延に敏感な企業向けに推論遅延を一桁マイクロ秒レベルに低減するソリューションを提供する。
Gemma 4でAIをエッジおよびオンデバイスに近づける
NVIDIAが最新のマルチモーダル・多言語モデル「Gemma 4」を発表し、クラウドからエッジデバイスまで幅広い展開に対応するモデルを提供した。
CUDAタイルプログラミングがBASICで利用可能に!
NVIDIAがCUDA 13.1でCUDA Tileを導入し、BASIC言語で細粒度並列処理をよりアクセスしやすく柔軟にする次世代タイルベースGPUプログラミングパラダイムを提供した。
NVIDIAの極限共同設計が新たなMLPerf推論記録を達成
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを実現し、MLPerf推論ベンチマークで新記録を樹立した。
NVIDIAプラットフォーム、極限の共同設計により最低トークンコストを実現
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを提供するプラットフォームを発表した。
統一サービスとリアルタイムAIによるAIファクトリーでのトークン生成の加速
NVIDIAは、統一サービスとリアルタイムAIを活用してAIファクトリーでのトークン生成を加速する方法を提案している。GPUの使用可能時間の1%低下が経済的・競争的影響をもたらす環境において、性能向上が重要であると指摘している。
NVIDIA CloudXR 6.0で高忠実度空間コンピューティングコンテンツをあらゆるデバイスにストリーミング
NVIDIAがCloudXR 6.0を発表し、高忠実度の空間コンピューティングコンテンツをあらゆるデバイスにストリーミング可能にした。これにより、XRハードウェアのGPU負荷を軽減しつつ、フォトリアリスティックなレンダリングとアクティブな共同作業を実現する。
NVIDIA CloudXR.jsでブラウザベースのXR体験を構築・ストリーミング
NVIDIAは、高品質なVR/AR体験をブラウザで提供するCloudXR.jsを発表した。これにより、ネイティブアプリ開発や複雑なデバイス管理が不要となり、企業ユーザーへのXR導入が容易になる。
未使用GPUワークロードを統合してAIインフラのスループットを最大化する
NVIDIAが、Kubernetes環境でモデル要件とGPUサイズの不一致による非効率性を解消するため、未使用GPUワークロードを統合する手法を提案している。
NVIDIA DRIVEにおける集中型レーダー処理がより安全でスマートなレベル4自律走行を実現する方法
NVIDIAが、NVIDIA DRIVEプラットフォームで集中型レーダー処理を実装し、従来のカメラと同等の生データを機械学習エンジニアが扱えるようにすることで、レベル4自律走行の安全性と知能性を向上させている。
生成モデルProteina-Complexaを用いたタンパク質結合剤の設計
NVIDIAの研究チームが、生成モデルProteina-Complexaを使用して、標的タンパク質に結合するタンパク質結合剤を設計する新手法を開発した。この技術は、タンパク質ベースの治療薬や触媒の開発を加速させる可能性がある。
ワット当たり性能の最大化によるトークンファクトリー収益とAI効率の拡大
NVIDIAは、AI時代において電力が最大の制約要因であると指摘し、ワット当たり性能の最適化がAIファクトリーの効率向上と収益拡大に不可欠だと主張している。
NVIDIA Nemotron 3エージェントの構築:推論、マルチモーダルRAG、音声、安全性
NVIDIAが、計画・推論・検索・安全制御を専門モデルが連携して処理するエージェントAIシステム「Nemotron 3」を開発した。
NVIDIA IGX Thorが産業・医療・ロボティクスのエッジAIアプリケーションを強化
NVIDIAがIGX Thorプラットフォームを発表し、産業・医療・ロボティクス分野で高性能AIを活用して作業効率や人間と機械の相互作用を向上させるエッジAIアプリケーションを強化する。
機密AIファクトリーのためのゼロトラストアーキテクチャ構築
NVIDIAは、機密データを扱うAIファクトリー向けにゼロトラストセキュリティアーキテクチャを提案している。企業の重要なデータの多くはパブリッククラウド外に存在するため、機密情報保護を目的とした新しいセキュリティ枠組みが必要とされている。
Kubernetes上での分散型LLM推論ワークロードのデプロイ
NVIDIAが、大規模言語モデル(LLM)推論ワークロードの複雑化に対応するため、Kubernetes上でプリフィル段階とデコード段階を分離した分散型推論アーキテクチャを提案している。
NVIDIA AI-QとLangChainによるエンタープライズ検索向けディープエージェントの構築方法
NVIDIAがLangChainと連携し、企業向けAIエージェント「AI-Q」を開発。データの断片化や文脈不足を解決するエンタープライズ検索ソリューションを提供する。
NVIDIAと共にAIグリッドを構築:あらゆる場所で知能をオーケストレートする
NVIDIAは、AIネイティブサービスがAIインフラの新たなボトルネックを露呈していると指摘し、数百万のユーザー・エージェント・デバイスが知能へのアクセスを求める中で、AIグリッド構築による課題解決を提案している。
病院自動化のためのロボットシステム構築におけるシミュレーション活用
NVIDIAは、2030年までに約1000万人の医療従事者が不足する医療危機に対応するため、シミュレーション技術を用いて病院自動化向けロボットシステムを開発している。
NVIDIA Groq 3 LPXの内部:NVIDIA Vera Rubinプラットフォーム向け低遅延推論アクセラレータ
NVIDIAは、NVIDIA Vera Rubinプラットフォーム向けに、低遅延・大規模コンテキスト対応のラックスケール推論アクセラレータ「Groq 3 LPX」を発表した。