2件の記事
The Verge AI は、グーグルが単に検索するだけでなく、検索ボックスからすべてのタスクを代行しようとしていると分析した。
研究者らが、LLMに統合された検索エージェントの評価における課題(高品質なベンチマーク構築の困難さと静的ベンチマークの陳腐化)を指摘し、新たな評価手法の必要性を論じている。