#nvidia model optimizer のAIニュース
2件の記事
NVIDIA モデル最適化器を用いた NVIDIA Nemotron 3 Ultra NVFP4 チェックポイントの作成方法
NVIDIA は、自社のモデル最適化ツール「NVIDIA Model Optimizer」を活用し、高精度な推論を可能にする「Nemotron 3 Ultra NVFP4」という新しいモデルチェックポイントを生成する手法を発表しました。
NVIDIA Developer Blog·6月27日·★★★★
モデル量子化:NVIDIA TensorRT で FP8 チェックポイントを高性能推論エンジンに変換する方法
NVIDIA は、TensorRT を活用して FP8 チェックポイントを高性能な推論エンジンへ変換する手法を公開した。これにより、AI モデルの推論速度と効率性が向上する。
NVIDIA Developer Blog·6月10日·★★★★