#slurm のAIニュース
2件の記事
Slurm ブロックスケジューリングによる NVIDIA GB200 NVL72 のシステム・ワークロード効率最大化
NVIDIA が提供する大規模 AI クラスタ「GB200 NVL72」において、Slurm 管理システムにブロックスケジューリングを導入することで、ハードウェアの性能を最大限引き出し、計算リソースの効率的な運用を実現する手法について解説している。
NVIDIA Developer Blog·5月8日·★★★★
【Python】PrefectでSLURMジョブを管理する〜HPC環境での機械学習ワークフロー構築に向けて〜
HPC環境での機械学習ワークフロー構築において、Prefectを用いてSLURMジョブを管理する方法を紹介。オンプレ環境のML学習部分の効率的な管理を目指す。
Spiral.AI Tech Blog·11月11日