#tensorrt のAIニュース
7件の記事
NVIDIA TensorRT を用いた複数 GPU での AI 推論のスケーリングとマルチデバイス推論サポートの紹介
NVIDIA は、TensorRT の新機能であるマルチデバイス推論サポートを活用し、複数の GPU にわたって AI 推論を効率的にスケーリングする手法を発表した。これにより大規模モデルの実行性能が向上する。
NVIDIA Developer Blog·6月26日·★★★★
モデル量子化:NVIDIA TensorRT で FP8 チェックポイントを高性能推論エンジンに変換する方法
NVIDIA は、TensorRT を活用して FP8 チェックポイントを高性能な推論エンジンへ変換する手法を公開した。これにより、AI モデルの推論速度と効率性が向上する。
NVIDIA Developer Blog·6月10日·★★★★
AI モデル推論パイプラインの摩擦を解消する方法
NVIDIA は、訓練済み AI モデルを実環境へ展開する際のボトルネック解消法を提示し、モデルのエクスポートや最適化プロセスにおける課題解決策を解説している。
NVIDIA Developer Blog·5月13日
NVIDIA Blackwellが金融分野におけるLLM推論でSTAC-AI記録を樹立
NVIDIAのBlackwellプラットフォームが、金融取引向け大規模言語モデルの推論性能でSTAC-AIベンチマーク記録を達成した。同技術は大量の非構造化データを分析し、金融取引の意思決定を支援する。
NVIDIA Developer Blog·3月6日·★★★★
NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化
NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。
NVIDIA Developer Blog·2月10日·★★★★
TensorRT最適化版Stable Diffusion 3.5、NVIDIA RTX GPUで2倍高速・VRAM40%削減
Stability AIとNVIDIAは、TensorRTで最適化したStable Diffusion 3.5モデルを公開した。これにより、NVIDIA RTX GPU上で最大2.3倍の高速生成とVRAM使用量の40%削減を実現し、幅広いGPUでの商用・非商用利用が可能となった。
Stability AI·6月13日·★★★★
Stable Diffusion 3.5モデル、TensorRT最適化によりNVIDIA RTX GPUで性能2倍向上・メモリ使用量40%削減を実現
Stability AIがNVIDIAと協力し、Stable Diffusion 3.5モデルをTensorRTで最適化した。これにより、NVIDIA RTX GPUでの画像生成速度が最大2.3倍向上し、VRAM使用量が40%削減された。
Stability AI·6月13日·★★★★