LLM2D

摘要

arXiv:2504.01980v1 宣告类型：交叉摘要：移动机器人自主探索由两个相互竞争的目标驱动：覆盖，即尽可能全面地观测环境；路径长度，即在最短路径上完成观测。虽然在不知道未知信息的情况下很难评估最佳行动方案，但通过模型、地图或常识可以理解未知信息。然而，以往的工作已经表明，通过上述先验知识提高信息获取估计会导致贪婪行为，并最终导致回溯，从而降低覆盖率。事实上，任何信息获取最大化都会表现出这种行为，即使没有先验知识也是如此。任务完成时获得的信息是固定的，无法最大化。因此，它不适合作为优化目标的选择。相反，信息获取是决定哪些候选状态仍应被考虑进行探索的决策标准。因此，任务变成了以最短的总路径长度完成任务。由于确定最短路径通常无法实现，因此有必要依赖启发式方法或估计来识别最小化总路径长度的候选状态。为了解决这个问题，我们提出了一种启发式方法，通过偏好那些距离机器人较近但与其他候选状态较远的候选状态来减少回溯。我们将在仿真中将所提出启发式的性能与基于信息获取的方法和前沿探索方法进行对比，并证明在有和没有环境先验知识的情况下，我们的方法显著缩短了总路径长度。