#リソース管理のAIニュース

6件の記事

AIネイティブチームのためのマルチテナントGPUクラスター設計ガイド：競合のない容量確保

Together AIは、チームの分離を損なうことなくGPUリソースを共有するマルチテナントクラスターの設計手法を実践例とともに解説している。

MITの研究者が、複数のストレージデバイスの性能変動を同時に処理するシステムを開発し、従来の手法よりも大幅な速度向上を実現した。

ScaleOpsがリアルタイムでインフラを自動化し、GPU不足とAIクラウドコスト高騰に対処するため、1億3000万ドルの資金調達を実施した。

NVIDIAが、Kubernetes環境でモデル要件とGPUサイズの不一致による非効率性を解消するため、未使用GPUワークロードを統合する手法を提案している。

PFNの坂内理人が、超高効率AI計算基盤向けKubernetesスケジューラの概念実証と評価ツールkube-scheduler-evaluatorを開発した。

Mercari Adsチームが、TiDBデータベースでオンライン処理とバッチ処理を単一クラスタで運用する中で発生したリソース競合問題を、TiDBのリソースグループ機能で解決した事例を紹介している。