#servicenow-ai のAIニュース
4件の記事
音声エージェントはバイリンガル顧客に対応できるか?コードスイッチング音声における最先端 ASR のベンチマーク
Hugging Face は、音声エージェントが言語を混在させた(コードスイッチング)音声に対してどの程度対応可能かを評価するため、最先端の自動音声認識(ASR)技術をベンチマークした。
Hugging Face Blog·6月10日·★★★★
EVA-Bench Data 2.0:3 ドメイン、121 ツール、213 シナリオ(9 分読了)
TLDR AI が公開した EVA-Bench データセットの第 2 版は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含む評価データを提供し、AI ツール利用能力の評価基準を強化します。
TLDR AI·6月5日·★★★★
EVA-Bench Data 2.0:3 つのドメイン、121 のツール、213 のシナリオ
Hugging Face が公開した評価ベンチマーク「EVA-Bench Data 2.0」は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含むデータセットであり、AI モデルの実用性を多角的に評価する基準を提供します。
Hugging Face Blog·6月4日·★★★★
vLLM V0 から V1:RL における修正前の正しさの重視
vLLM チームは、強化学習(RL)を適用する際、モデルの性能を向上させるための修正を行う前に、まず推論結果の正確性を確保することが重要であると発表した。
Hugging Face Blog·5月7日·★★★★