2件の記事
階躍は新世代音声生成モデル「StepAudio 2.5 TTS」を発表した。このモデルは、グローバル文脈制御、文中文脈制御、ゼロショット音声複製、全音色制御の3つのコア機能により、より自然で柔軟かつ表現力豊かな音声生成を実現する。
通義実験室が、自然言語指令で自由な表現を生成できる音声モデル「Fun-CosyVoice」を発表した。従来の固定ラベル制限を突破し、ユーザーが詳細な表現を直接指示できる新方式を導入した。