#text-to-speech のAIニュース
5件の記事
Gemini 3.1 Flash TTS:表現豊かな次世代AI音声の登場
Googleは、Gemini 3.1 Flash TTSを全Google製品で提供開始した。この新技術は、感情豊かな自然な音声合成を実現し、ユーザー体験を向上させる。
Google AI Blog·4月16日·★★★★
Mistralが音声生成の新たなオープンソースモデルをリリース
Mistralがスマートウォッチやスマートフォン上で動作可能な新たな音声生成オープンソースモデルをリリースした。
TechCrunch AI·3月26日·★★★★
Inworld TTS-1.5 Maxがfalプラットフォームで利用可能に
Inworldは、低遅延・高表現力・多言語対応の音声生成モデル「TTS-1.5 Max」をfalプラットフォームに追加した。これにより、開発者はアシスタントやメディア体験など、本番環境でのリアルタイム音声インターフェース構築を強化できる。
fal.ai Blog·3月25日
Hume AIがTADAをオープンソース化、競合より5倍高速で幻覚ゼロの音声モデル
Hume AIはMITライセンスでTADAを公開した。この高速音声生成モデルはテキストと音声を同期処理し、テストで幻覚を一切発生させなかった。
The Decoder·3月14日·★★★★
Chatterbox Turboがfalプラットフォームで利用可能に
リアルタイム音声AI向けオープンソースの高速テキスト読み上げモデル「Chatterbox Turbo」が、開発プラットフォーム「fal」で提供開始された。150ミリ秒以内の応答速度と感情豊かな音声合成、即時の声クローニング機能を備え、エージェントが自然な声でユーザーと対話できるようになる。
fal.ai Blog·12月16日·★★★★