#speech-to-speech のAIニュース

6件の記事

Amazon Nova 2 Sonic を活用した医療予約エージェントの構築方法

AWS は、米国医療機関で問題となる欠席率の高さに対応するため、Amazon Nova 2 Sonic を使用して患者の予約確認や再調整を行う自動エージェントを構築する手法を公開しました。

AWS Machine Learning Blog·6月25日·★★★★

Loka が Amazon Nova 2 Sonic を活用した低遅延・自然な音声エージェントを構築

Loka は AWS ベースのソリューションで、Amazon Nova 2 Sonic を用いて顧客との対話を自然かつ低遅延に実現する会話型 AI エージェントを開発し、音声推論精度も向上させた。

AWS Machine Learning Blog·6月25日·★★★★

Stream Vision Agents と Amazon Nova 2 Sonic を用いたリアルタイム音声エージェントの実装

ストリームとアマゾンは、自然で応答性の高い生産グレードの音声エージェントを構築する技術について解説し、音声モデルの調整や低遅延オーディオストリーミング管理の方法を示した。

AWS Machine Learning Blog·5月15日·★★★★

Amazon Nova Sonic と WebRTC を用いたリアルタイム音声ストリーミングアプリケーションの構築

アマゾンは、ネットワーク帯域制限や言語壁、スケーラビリティといった課題に対し、Nova Sonic と WebRTC を組み合わせた新技術で、低遅延かつ高品質な多言語対応のリアルタイム音声アプリ開発を可能にするソリューションを発表した。

AWS Machine Learning Blog·5月14日·★★★★

リアルタイム音声対話 AI の知識強化を目指す Tandem アーキテクチャ「KAME」が ICASSP2026 に採択

研究者らが、思考を深めつつ遅延なく応答する新アーキテクチャ「KAME」を発表し、ICASSP2026 で採用された。これにより、従来の浅い推論に留まっていた高速音声 AI の知能が向上する可能性がある。

Sakana AI·4月29日·★★★★

S2S API比較:RAG編 〜Speech-to-SpeechでRAGを使うなら、何を選ぶべきか

筆者はGPTやGeminiなどのS2S APIを比較し、RAG連携システム構築では対話性能より「正確な文書取得」と「検索結果の会話処理」が重要であると指摘している。

HEROZ Tech Blog·4月21日·★★★★