1件の記事
マイクロソフト研究所は、AI エージェントがユーザーの代わりに交渉や対話を行う際に必要な社会的推論能力を評価する「SocialReasoning-Bench」を発表した。このベンチマークは、2 つの実用的なシナリオにおいて、エージェントがユーザーの最善の利益のために行動できるかをテストするものである。