#大規模モデルトレーニング のAIニュース
2件の記事
NVIDIA Blackwell を用いた Amazon SageMaker AI でのモデル学習の最適化
AWS は、NVIDIA の最新 GPU「Blackwell」を活用することで、Amazon SageMaker AI 上で大規模 AI モデルの学習におけるメモリ制約やシーケンス長の制限といった課題を克服し、実用的な運用範囲を広げる方法を発表した。
AWS Machine Learning Blog·6月26日·★★★★
Decoupled DiLoCo:堅牢な分散型AI学習の新たな最前線
研究者は「Decoupled DiLoCo」と呼ばれる新アルゴリズムを開発し、分散型AI学習における耐障害性と通信効率を大幅に向上させた。
Google DeepMind·4月22日·★★★★