#リソース管理 のAIニュース
6件の記事
AIネイティブチームのためのマルチテナントGPUクラスター設計ガイド:競合のない容量確保
Together AIは、チームの分離を損なうことなくGPUリソースを共有するマルチテナントクラスターの設計手法を実践例とともに解説している。
Together AI Blog·4月21日
データセンターがより少ないハードウェアで高性能を実現するための支援
MITの研究者が、複数のストレージデバイスの性能変動を同時に処理するシステムを開発し、従来の手法よりも大幅な速度向上を実現した。
MIT ML News·4月7日·★★★★
ScaleOpsがAI需要高騰の中、コンピューティング効率向上のために1億3000万ドルを調達
ScaleOpsがリアルタイムでインフラを自動化し、GPU不足とAIクラウドコスト高騰に対処するため、1億3000万ドルの資金調達を実施した。
TechCrunch AI·3月30日·★★★★
未使用GPUワークロードを統合してAIインフラのスループットを最大化する
NVIDIAが、Kubernetes環境でモデル要件とGPUサイズの不一致による非効率性を解消するため、未使用GPUワークロードを統合する手法を提案している。
NVIDIA Developer Blog·3月26日
超高効率AI計算基盤向けKubernetesスケジューラとkube-scheduler-evaluatorの検討
PFNの坂内理人が、超高効率AI計算基盤向けKubernetesスケジューラの概念実証と評価ツールkube-scheduler-evaluatorを開発した。
Preferred Networks·3月9日
TiDBリソースグループによるワークロード制御
Mercari Adsチームが、TiDBデータベースでオンライン処理とバッチ処理を単一クラスタで運用する中で発生したリソース競合問題を、TiDBのリソースグループ機能で解決した事例を紹介している。
Mercari Engineering·12月15日