#音声生成のAIニュース

3件の記事

Gemini 3.1 Flash TTS の公開

Google はプロンプトで制御可能な新しいテキスト読み上げモデル「Gemini 3.1 Flash TTS」を公開した。Gemini API経由で提供され、音声ファイルの出力のみに対応している。

Simon Willison Blog·4月16日

Amazon Nova 2 Sonicでリアルタイム会話型ポッドキャストを構築

Amazonが、高度な音声理解・生成モデル「Nova 2 Sonic」を発表し、コンテンツ制作者や組織が、従来の制作プロセス（企画・録音・編集）の課題を克服し、高品質な音声コンテンツを迅速に量産できるリアルタイム会話型ポッドキャスト制作を可能にした。

AWS Machine Learning Blog·4月8日·★★★★

OpenAIのSoraはスマホで最も不気味なアプリだった――今、サービス終了へ

OpenAIはAI専用ソーシャルフィードアプリ「Sora」のサービスを終了する。Sora 2動画・音声生成モデルは印象的だが、ユーザーの持続的関心が得られなかったため。

TechCrunch AI·3月25日