1件の記事
Stability AIとArmは、3億4100万パラメータのテキスト音声変換モデル「Stable Audio Open Small」をオープンソース公開した。Arm CPU向けに最適化され、スマートフォンで8秒以内に11秒分の音声を生成可能。これにより、デバイス上でのリアルタイム音声生成の実用化が進む。