摘要
集成任务和运动规划 (TAMP) 已被证明是解决可泛化长时域机器人操作和导航问题的宝贵方法。然而,典型的 TAMP 问题公式假设完全可观察性和确定性动作效果。这些假设限制了规划器收集信息和做出风险意识决策的能力。我们提出了一种具有不确定性和风险意识的 TAMP (TAMPURA) 策略,该策略能够有效地解决具有初始状态和动作结果不确定性的长时域规划问题,包括需要信息收集和避免不良和不可逆结果的问题。我们的规划器在抽象任务级别和连续控制器级别都进行不确定性推理。给定一组在原始动作空间中运行的闭环目标条件控制器,以及对其先决条件和潜在能力的描述,我们学习一个可以有效解决的高级抽象,然后将其细化为连续动作以执行。我们在几个机器人问题上展示了我们的方法,其中不确定性是一个关键因素,并表明在这些问题中进行不确定性推理优于先前提出的确定化规划、直接搜索和强化学习策略。最后,我们使用概率感知的最新进展,在两个现实世界的机器人问题上展示了我们的规划器。