1件の記事
DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。