LLM2D

摘要

arXiv:2410.15178v3 宣告类型: replace-cross 摘要：自主车辆在复杂环境中执行导航任务面临重大挑战，由于状态估计中的不确定性。在许多场景中，如隐蔽操作或资源受限的设置中，获取高精度定位的成本很高，迫使机器人主要依赖较低精度的状态估计。我们的关键观察是，不同的任务在不同的区域需要不同程度的精度：一个在拥挤空间中导航的机器人可能需要在障碍物附近精确的定位，但在其他地方可以有效地工作在较低精度下。在本文中，我们将提出一种规划方法，将任务特定的不确定性要求直接整合进导航策略中。我们引入了任务特定不确定性图（TSUMs），它跨越不同区域抽象出可接受的状态估计不确定性水平。TSUMs 使用共享表示空间将任务需求和环境特征对齐，该空间通过领域适配编码器生成。使用 TSUMs，我们提出了综合决策和执行中的不确定性（GUIDE）泛化不确定性整合策略框架，将这些不确定性要求整合进机器人的决策中。我们发现，TSUMs 提供了一种有效的方法来抽象任务特定的不确定性要求，并基于 TSUMs 调整策略使机器人能够根据上下文条件考虑不确定性价值并相应地调整其行为。我们展示了将 GUIDE 整合到强化学习框架中如何使代理能够在没有显式奖励工程的情况下学习平衡任务完成和不确定性管理的导航策略。我们对各种实际机器人导航任务进行了 EVALUATION，发现与那些没有明确考虑任务特定不确定性基线方法相比，GUIDE 显示出显著提高的任务完成率。