2件の記事
NVIDIA は、高度な融合カーネル技術を活用することで、混合専門家モデル(MoE)の学習処理速度を大幅に向上させる手法を発表した。
機械学習におけるGEMM演算後のバイアスや活性化などの小規模処理を、レジスタ内で統合実行する「エピローグ融合」手法について解説。これによりグローバルメモリへの不要な読み書きを削減し、計算効率を向上させる技術的アプローチを示している。