#deep learning optimization のAIニュース

2件の記事

高度な融合カーネルによる MoE 学習スループットの向上

NVIDIA は、高度な融合カーネル技術を活用することで、混合専門家モデル（MoE）の学習処理速度を大幅に向上させる手法を発表した。

機械学習におけるGEMM演算後のバイアスや活性化などの小規模処理を、レジスタ内で統合実行する「エピローグ融合」手法について解説。これによりグローバルメモリへの不要な読み書きを削減し、計算効率を向上させる技術的アプローチを示している。