メインコンテンツへスキップ

#リアルタイム ai のAIニュース

5件の記事

AI Gateway でリアルタイム音声エージェントを構築可能に

Vercel は AI Gateway にオーディオ機能を追加し、OpenAI や xAI のモデルを用いてリアルタイム音声、テキスト読み上げ、音声認識を既存の API 呼び出しで利用できるようにした。この機能はベータ版として AI SDK 7 で提供されている。

Vercel Blog·6月29日·★★★★

AI Gateway でリアルタイム音声・通話・文字起こしがサポートされるように

Vercel は AI Gateway に音声およびオーディオモデルのサポートを追加し、リアルタイム音声エージェントの構築やテキストから音声への生成、音声の文字起こし機能をベータ版として提供開始した。

Vercel Blog·6月29日·★★★★

DAQIRI を活用して高速データ収集におけるリアルタイム AI を実現

NVIDIA は、DAQIRI という技術を用いることで、高速なデータ収集プロセスにおいてリアルタイムでの AI 処理を可能にする機能を発表した。

NVIDIA Developer Blog·6月23日

Google、Meet・翻訳・ライブ API で 70 言語以上対応のストリーミング音声対音声モデル「Gemini 3.5 Live Translate」を公開

Google は、70 以上の言語を自動検知し、話者のイントネーションやピッチを保ちながら連続的に翻訳音声を生成する新モデル「Gemini 3.5 Live Translate」を発表した。この技術は Meet、翻訳サービス、ライブ API で利用可能となる。

MarkTechPost·6月10日·★★★★

対話モデル:人間と AI の協調のためのスケーラブルなアプローチ

シンキングマシーンズラボは、音声・動画・テキストを横断するリアルタイムな人間と AI の協働を実現する新研究「対話モデル」を発表した。このモデルはマルチストリーム設計でゼロから学習し、従来のターン制の制限を取り除き、双方向の継続的なやり取りを可能にする。

TLDR AI·5月12日·★★★★