NVIDIA Developer Blog の最新記事
公式162件の記事
速度を落とさないハードウェア基盤の AI セキュリティ
NVIDIA は、処理速度を低下させることなく AI システムを保護する新しいハードウェアベースのセキュリティ技術を発表した。
エージェント技術の習得:AI エージェント強化学習
NVIDIA は、AI エージェントが自律的にタスクを遂行するための強化学習手法について解説し、その技術的アプローチと応用可能性を示した。
NVIDIA GQE を用いた GPU アクセラレーションされたクエリエンジンの設計
NVIDIA は、同社の GQE(GPU Query Engine)技術を活用して、高速なデータ検索を実現する GPU アクセラレーションされたクエリエンジンを設計する方法を公開した。
NVIDIA Nsight 開発ツールを用いたニューラル再構築パイプラインの最適化
NVIDIA は、同社の Nsight 開発ツールを活用することで、ニューラル再構築パイプラインのパフォーマンスを大幅に向上させる手法を発表した。
エンタープライズ AI ファクトリーにおける自律型エージェントのガバナンス方法
NVIDIA は、チャットを超えてコード検査やシステム操作を行う自律型エージェントを企業環境で安全に運用するためのガバナンス手法を解説している。
Oracle Cloud Infrastructure上で本番対応のNVIDIA AI-Qブループリントをデプロイする方法
NVIDIAは、Oracle Cloud Infrastructure上でAIエージェントやマルチターンチャットに対応した本番環境向けAI-Qブループリントの展開方法を公開しました。
NVIDIA モデル最適化器を用いた NVIDIA Nemotron 3 Ultra NVFP4 チェックポイントの作成方法
NVIDIA は、自社のモデル最適化ツール「NVIDIA Model Optimizer」を活用し、高精度な推論を可能にする「Nemotron 3 Ultra NVFP4」という新しいモデルチェックポイントを生成する手法を発表しました。
Vulkan デスクリプタヒープの包括的サポートによるリソースバインディングの効率化
NVIDIA は、シェーダー処理における視覚データ処理を最適化するため、Vulkan デスクリプタヒープへのエンドツーエンドサポートを追加し、リソースバインディングプロセスを簡素化した。
NVIDIA TensorRT を用いた複数 GPU での AI 推論のスケーリングとマルチデバイス推論サポートの紹介
NVIDIA は、TensorRT の新機能であるマルチデバイス推論サポートを活用し、複数の GPU にわたって AI 推論を効率的にスケーリングする手法を発表した。これにより大規模モデルの実行性能が向上する。
NVIDIA ACE を活用した KRAFTON の共演可能キャラクター「PUBG Ally」の構築方法
ゲーム開発会社 KRAFTON は、NVIDIA の AI 技術プラットフォーム「ACE」を活用し、プレイヤーと対話可能な共演可能キャラクター「PUBG Ally」を PUBG に実装した。
物理的 AI アプリケーション向け NVIDIA GPU における BEV ポーリングの高速化
NVIDIA は、物理的 AI アプリケーションにおいて BEV(Bird's Eye View)ポーリング処理を NVIDIA GPU で加速する手法を発表した。これにより、自動運転やロボティクスなどのリアルタイム処理性能が向上する。
フルスタック推論・学習最適化による AI ファクトリのエネルギー効率最大化
NVIDIA は、AI ファクトリ全体のエネルギー効率を向上させるため、推論と学習の両面で最適化手法を提案している。
NVIDIA Blackwell で DFlash 推測デコーディングを活用し、推論パフォーマンスを最大 15 倍に向上
NVIDIA は、DFlash 推測デコーディング技術を採用することで、Blackwell アーキテクチャ上の推論パフォーマンスを最大 15 倍まで向上させることに成功したと発表した。
NVIDIA BioNeMo Agent Toolkit を活用したライフサイエンス発見のための AI 科学者構築
NVIDIA は、論文の読解やコード記述、仮説生成などを行うエージェント機能を提供する「BioNeMo Agent Toolkit」を公開し、AI 科学者をライフサイエンス研究に導入する手法を発表した。
エージェント型 AI を活用した自律型ネットワークの構築方法:通信事業者が取り組むべき道筋
NVIDIA は、通信事業者がネットワーク運用や顧客対応において AI を導入している現状を踏まえ、自律化への道のりについて解説しています。
CCCL ランタイム:CUDA 向けのモダンな C++ ランタイム
NVIDIA が CUDA 環境向けに設計した、モダンな C++ ランタイム「CCCL」を発表しました。これにより、開発者はより効率的かつ安全に GPU 計算リソースを活用できるようになります。
DAQIRI を活用して高速データ収集におけるリアルタイム AI を実現
NVIDIA は、DAQIRI という技術を用いることで、高速なデータ収集プロセスにおいてリアルタイムでの AI 処理を可能にする機能を発表した。
NVIDIA XR AI を用いた AR グラスおよび XR デバイス向け AI エージェントの構築
NVIDIA は、AR グラスや XR デバイス上で動作する AI エージェントを構築するための技術とアプローチを NVIDIA Developer Blog で発表した。
金融インテリジェンスのためのトランザクション基盤モデルを自作する
NVIDIA は、金融分野の知見を活用した独自のトランザクション基盤モデルを構築する方法を提示し、業界への応用可能性を示唆している。
NVIDIA ACE ゲームエージェント SDK と Unreal Engine 5 プラグインを用いたオンデバイス AI コンパニオンの構築
NVIDIA は、Unreal Engine 5 の RTX ブランチおよび DLSS プラグインを活用し、オンデバイスで動作する AI ゲームキャラクター(コンパニオン)を構築するための SDK とプラグインを発表した。
低精度トレーニングにおけるトランスフォーマーベースモデルの最適化手法
NVIDIA は、低精度トレーニングでトランスフォーマーモデルを効率的に実行するための具体的な最適化手法をブログ記事で公開した。
NVIDIA Blackwell、MLPerf Training 6.0 で業界をリードするスケーラビリティとパフォーマンスを獲得し首位に
NVIDIA は、同社の最新 AI チップセット「Blackwell」が MLPerf Training 6.0 ベンチマークで業界最高水準のスケーラビリティとパフォーマンスを発揮し、首位を獲得したことを発表した。
NVIDIA BioNeMoレシピを用いたLoRAによる生物学的基盤モデルのファインチューニング
NVIDIAは、BioNeMoレシピを活用してLoRA技術で生物学的基盤モデルを効率的にファインチューニングする方法を発表した。
高度な融合カーネルによる MoE 学習スループットの向上
NVIDIA は、高度な融合カーネル技術を活用することで、混合専門家モデル(MoE)の学習処理速度を大幅に向上させる手法を発表した。
想像に預けられ、行動のために微調整:ワールド・アクションモデルの台頭
NVIDIA は、事前学習されたビジョン言語モデルを基盤とし、ロボット制御に適応させた「ワールド・アクションモデル(WAM)」という新しい技術の登場を発表した。これは、視覚と言語を理解する能力を行動計画に転用するアプローチである。
NVIDIA、初のエージェント型 AI ベンチマークでコーディング性能において業界最高を達成
NVIDIA が実施した最初のエージェント型 AI ベンチマークにおいて、同社の技術が他の競合製品を上回るコーディング性能を示し、業界トップの成果を記録しました。
NVIDIA 加速インフラ上で MiniMax M3 を活用した長文脈推論とエージェントワークフローの展開
NVIDIA は、自社の加速インフラ上で中国の AI 企業 MiniMax が開発したモデル「M3」を活用し、長文脈の推論処理や自律的なエージェントワークフローを効率的に展開する手法を発表しました。
NVIDIA Quantum InfiniBand でワンクリックのマルチテナントセキュリティを実現
NVIDIA は、Unified Fabric Manager に意図ベースのセキュリティプロファイルを追加し、単一のインフラでマルチテナント環境のファブリックセキュリティをワンクリックで実現可能にした。
開発者向け高スループットテキスト生成のために NVIDIA で DiffusionGemma を実行する
NVIDIA は、開発者が NVIDIA のプラットフォーム上で DiffusionGemma モデルを実行し、高速なテキスト生成を実現する方法を公開した。
AI ファクトリー向けに設計された実用化可能なバッテリーエネルギー貯蔵システム
NVIDIA は、大規模な AI ファクトリーの電力需要に対応するため、実用レベルのバッテリーエネルギー貯蔵システムの設計手法を提案している。
NVIDIA DGX Spark を用いた大規模 AI インフラのライフサイクル管理機能の提供
NVIDIA は、大規模な AI インフラにおいてライフサイクル制御を実現する新機能「DGX Spark Enterprise Manageability」を発表した。これにより、企業はインフラの運用効率を向上させられる。
モデル量子化:NVIDIA TensorRT で FP8 チェックポイントを高性能推論エンジンに変換する方法
NVIDIA は、TensorRT を活用して FP8 チェックポイントを高性能な推論エンジンへ変換する手法を公開した。これにより、AI モデルの推論速度と効率性が向上する。
AI エージェントと NVIDIA FLARE Auto-FL を用いた連合学習研究の加速
NVIDIA は、AI エージェントおよび同社の FLARE Auto-FL ツールを活用することで、連合学習の研究開発プロセスを大幅に加速させることを発表した。
NVIDIA Blackwell で NVFP4 を使用し、JAX と MaxText でモデルの学習を高速化
NVIDIA は、Blackwell アーキテクチャ上で NVFP4 技術を活用することで、JAX および MaxText を用いた大規模言語モデルの前学習処理におけるスループットが向上し、学習速度が大幅に改善されることを発表した。
NVIDIA Nemotron 3 Ultra が長時間実行型エージェントの推論を高速化・効率化
NVIDIA は、長時間実行型エージェントが推論を行い、文脈を維持し、ツールを活用して効率的に動作するための新モデル「Nemotron 3 Ultra」を発表した。これにより、単発チャットボットから複雑なタスクをこなすエージェントへの進化が加速する。
マイクロソフトと NVIDIA の新ツールを用いて Windows PC でパーソナル AI エージェントを構築する
マイクロソフトと NVIDIA は、Windows PC 上でパーソナル AI エージェントを構築するための新ツールを提供した。これにより開発者はローカル環境で効率的にエージェントを設計・実装できる。
メモリ効率を重視し、エッジでエージェント対応 AI を展開する NVIDIA JetPack 7.2 の発表
NVIDIA は、AI エージェントが物理環境へ移行する際に実世界での展開を加速させるため、メモリ効率を最適化した「NVIDIA JetPack 7.2」を発表した。これにより、NVIDIA Jetson 上でエッジデバイス向けの実用的な AI エージェントの導入が可能となる。
NVIDIA DGX Spark で高速モデルとマルチノードクラスタリングを活用し、ローカル AI エージェントを実行可能に
NVIDIA は、DGX Spark システム上で高速な AI モデルとマルチノードクラスタリング技術を利用することで、ユーザーがローカル環境で効率的に AI エージェントを実行できる機能を発表した。
NVIDIA アルパマイヨを用いたクローズドループでの自動運転モデルのポストトレーニング手法
NVIDIA は、アルパマイヨプラットフォームを活用して自動運転モデルをクローズドループ環境でポストトレーニングする具体的な方法を公開した。これにより、シミュレーション上での効率的な学習と評価が可能となる。
NVIDIA Cosmos 3 で物理 AI の推論・世界モデル・行動モデルを開発する
NVIDIA は、ロボットや自律走行車などが現実世界を理解して動作するために必要な物理 AI の推論、世界モデル、行動モデルを構築できる「Cosmos 3」を発表した。
NVIDIA DOCA を用いたアジェンティック AI のインフラ強化とインシリコンセキュリティの進展
NVIDIA は、DOCA(Data Center Operations Architecture)を活用したインシリコンセキュリティ技術を発表し、アジェンティック AI 向けの基盤インフラを強化する。これにより、AI エージェント間の通信や処理におけるセキュリティが向上する。
NVIDIA Vera CPU が AI ファクトリーにおけるアジェンティックワークロードの新たな基準を設定
NVIDIA は、同社が発表した新 CPU「Vera」について、AI ファクトリーで動作するアジェンティックワークロードのパフォーマンスと効率性を支える新たな業界標準として位置づけたことを発表しました。
NVIDIA DSX OS が大規模な AI ファクトリ向けにオープンでモジュラーなソフトウェアを提供
NVIDIA は、大規模な AI ファクトリの運用を可能にするオープンかつモジュラーなソフトウェア「DSX OS」を発表した。これにより、企業は柔軟に AI インフラを構築・管理できるようになる。
DynoSim:パレートフロンティアのシミュレーション
NVIDIA は、現代の大規模言語モデル(LLM)の推論サービス設定が複雑である課題に対し、モデルバックエンドや並列形状などの相互作用する選択をシミュレーションする「DynoSim」を発表した。これにより、最適なパフォーマンスとコストのバランス(パレートフロンティア)を効率的に見つけることが可能になる。
NVIDIA MCG ツールキットを用いた AI モデル文書作成の自動化方法
NVIDIA は、MCG ツールキットを活用して AI モデルのドキュメント作成を自動化する手法を発表した。これにより開発効率が向上し、標準化された文書生成が可能となる。
エンタープライズ対応マルチモーダルAI「Step 3.7 Flash」をNVIDIA GPU上で実行可能に
NVIDIAが、エンタープライズ向けマルチモーダルAIモデル「Step 3.7 Flash」を自社のGPU環境で効率的に実行できる機能を公開した。これにより、企業は高性能なAI処理を迅速に導入できるようになる。
NVIDIA Dynamo スナップショット:Kubernetes 上の推論ワークロードにおける高速起動
NVIDIA は、Kubernetes 環境で実行される推論ワークロードの起動時間を大幅に短縮する「Dynamo」のスナップショットを公開しました。これにより、AI サービスの展開効率が向上します。
NVIDIA RTX:UE5向けDLSS 4.5と多言語AIキャラクターの新機能
NVIDIAは、ゲーム開発者向けにUE5対応のDLSS 4.5と多言語対応可能なAIキャラクター機能を搭載したRTX技術を発表し、AI駆動のキャラクターやフレーム生成、レイトレーシング描画へのアクセス経路を強化しました。
NVIDIA CompileIQによる自動チューニングでカーネルパフォーマンスを最大化
NVIDIAは、特定の環境に最適なコンパイラオプションを見つけるという難問に対し、CompileIQの自動チューニング機能を活用することで、より高いカーネルパフォーマンスを引き出す方法を発表した。
NVIDIA CUDA Tile を用いた C++ による高性能 GPU カーネルの開発
開発者は、既存の大型 C++ GPU コードベース内で NVIDIA CUDA Tile プログラミングを活用し、タイルベース手法を用いて高度に最適化された GPU カーネルを開発できるようになった。