#コードスイッチング のAIニュース
3件の記事
音声エージェントはバイリンガル顧客に対応できるか?コードスイッチング音声における最先端 ASR のベンチマーク
Hugging Face は、音声エージェントが言語を混在させた(コードスイッチング)音声に対してどの程度対応可能かを評価するため、最先端の自動音声認識(ASR)技術をベンチマークした。
Hugging Face Blog·6月10日·★★★★
Google が Gboard に Gemini 搭載の音声入力機能を追加、Dictation 系スタートアップに打撃となる可能性
Google はキーボードアプリ「Gboard」に生成 AI「Gemini」を活用した音声入力機能を追加し、既存の音声入力専門スタートアップの事業環境を悪化させる可能性がある。
TechCrunch AI·5月13日·★★★★
故郷の方言でこのAIをテストしてみませんか?
通義实验室は音声認識大模型「Fun-ASR1.5」をリリースした。同モデルは30言語と7大方言を単一アーキテクチャで処理し、典型方言の誤り率を56%削減して工業級の実用化を実現した。
通义大模型·4月20日