#text-to-speech のAIニュース

5件の記事

Gemini 3.1 Flash TTS:表現豊かな次世代AI音声の登場

Googleは、Gemini 3.1 Flash TTSを全Google製品で提供開始した。この新技術は、感情豊かな自然な音声合成を実現し、ユーザー体験を向上させる。

Google AI Blog·4月16日·★★★★

Mistralが音声生成の新たなオープンソースモデルをリリース

Mistralがスマートウォッチやスマートフォン上で動作可能な新たな音声生成オープンソースモデルをリリースした。

TechCrunch AI·3月26日·★★★★

Inworld TTS-1.5 Maxがfalプラットフォームで利用可能に

Inworldは、低遅延・高表現力・多言語対応の音声生成モデル「TTS-1.5 Max」をfalプラットフォームに追加した。これにより、開発者はアシスタントやメディア体験など、本番環境でのリアルタイム音声インターフェース構築を強化できる。

fal.ai Blog·3月25日

Hume AIがTADAをオープンソース化、競合より5倍高速で幻覚ゼロの音声モデル

Hume AIはMITライセンスでTADAを公開した。この高速音声生成モデルはテキストと音声を同期処理し、テストで幻覚を一切発生させなかった。

The Decoder·3月14日·★★★★

Chatterbox Turboがfalプラットフォームで利用可能に

リアルタイム音声AI向けオープンソースの高速テキスト読み上げモデル「Chatterbox Turbo」が、開発プラットフォーム「fal」で提供開始された。150ミリ秒以内の応答速度と感情豊かな音声合成、即時の声クローニング機能を備え、エージェントが自然な声でユーザーと対話できるようになる。

fal.ai Blog·12月16日·★★★★