#評価 のAIニュース
2件の記事
ポッドキャスト:タイガーチーム、評価、エージェント:新たなAIエンジニアリングのプレイブック
Mastraの共同創業者兼CEOのサム・バグワットが、オープンソースコミュニティの構築と維持、AIエンジニアリングと評価の新たな分野、エージェントアプリケーションの開発におけるクロスファンクショナルなタイガーチームの重要性について語った。
InfoQ·4月10日
多言語推論ジム:手続き的推論環境の多言語スケーリング
研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。
Apple Machine Learning·3月13日·★★★★