#nvidia nemo のAIニュース
6件の記事
NVIDIA NeMo AutoModelによるTransformersの微調整加速
NVIDIAはHugging FaceでNeMo AutoModelを公開し、Qwen3やDeepSeek V3のような大規模Mixture-of-Expertsアーキテクチャの微調整パイプラインを最適化した。同フレームワークはExpert ParallelismとDeepEP融合通信カーネルを導入し、GPUクラスター上で専門的なエキスパート重みを動的に分散させることで、トレーニングスループットを最大3.7倍向上させ、ピークGPUメモリ使用量を32%削減した。
NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化
Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。
「AIエージェントキャッチアップ #74 - NemoClaw」を開催しました
ジェネラティブエージェンツは勉強会「AIエージェントキャッチアップ #74」を開催し、NVIDIAが公開する常時稼働アシスタント実行フレームワーク「NemoClaw」の安全な運用方法について解説しました。
NTTデータとNVIDIA、企業向けAIファクトリーを生産規模で提供
NTTデータは、企業がAIを拡張するための再現可能で本番環境対応のモデルを提供するNVIDIA搭載プラットフォームの提供を発表した。このプラットフォームは、NVIDIAのGPU高速コンピューティングと高性能ネットワーキング、NVIDIA AI Enterpriseソフトウェアを統合し、クラウドおよびエッジ環境に展開可能なフルスタックのエージェントAIプラットフォームを構成する。
Amazon EC2上でのNVIDIA Nemotron Speech ASRのドメイン適応のためのファインチューニング
AWS、NVIDIA、Heidiが協力し、Amazon EC2上でNVIDIA Nemotron Speech ASRモデルを特定ドメイン向けにファインチューニングする方法を紹介している。医療・顧客サービスなどの分野で音声認識精度を向上させる取り組みである。
NVFP4低精度モデルトレーニングによる精度を損なわない高スループットの実現
NVIDIAのNVFP4低精度トレーニング技術は、モデルの精度を維持しながら計算スループットを向上させ、AI開発の効率化とコスト削減に貢献する。