1件の記事
Microsoftの研究チームは、VLMベースのロボット計画モデルが複雑な長期タスクで直面する曖昧性問題を評価するGroundedPlanBenchを開発した。このベンチマークは、モデルが多様な実世界シナリオで行動とその発生場所を計画できるかを測定する。