摘要
arXiv:2504.14773v1 宣告类型: 新
摘要: 规划是代理和代理型人工智能的核心。规划能力,例如在预算范围内创建旅行计划,无论是在科学还是商业领域都有着巨大的潜力。此外,最优计划通常比起即兴方法需要更少的资源。到目前为止,对现有规划基准的全面理解似乎仍然缺乏。缺乏这种理解,在不同领域比较规划算法的性能或为新场景选择合适的算法仍然具有挑战性。在本文中,我们检查了一系列规划基准,以识别算法开发中常用的测试环境,并指出潜在的差距。这些基准被分类为具身环境、网络导航、调度、游戏和拼图以及日常生活任务自动化。我们的研究推荐适用于各种算法的最佳基准,并提供指导未来基准开发的洞见。