#llm planning のAIニュース
2件の記事
ServiceNow Researchが「EnterpriseOps-Gym」を公開:現実的な企業環境におけるエージェント型計画評価の高忠実度ベンチマーク
ServiceNow Research、Mila、モントリオール大学は、大規模言語モデルの企業実装課題を解決するため、長期計画や状態変化を評価するベンチマーク「EnterpriseOps-Gym」を開発した。
MarkTechPost·3月18日·★★★★
HiMAP-Travel: 長期間制約付き旅行のための階層型マルチエージェント計画
研究チームは、予算や多様性要件などの厳しい制約がある長期間計画において逐次LLMエージェントが失敗する問題を解決するため、階層型マルチエージェントフレームワーク「HiMAP-Travel」を提案した。このフレームワークは、戦略的調整と並列的な日次実行に計画を分割し、コーディネーターが日々のリソースを割り当て、日次実行者が並列で独立して計画を実行する。
ArXiv cs.AI·3月6日·★★★★