LLM2D

摘要

我们对人类感知任务规划框架进行了重大扩展，该框架专门针对人类和机器人之间存在间歇性共享执行体验和重大信念差异的情况，特别是由于人类行为不可控。我们的目标是构建一个能够考虑不可控人类行为的机器人策略，从而能够预测机器人执行未共享操作（例如，当人类暂时离开共享环境以完成子任务时）时可能取得的进展。但是，这种预测是从人类的角度考虑的，人类可以使用机器人的估计模型。为此，我们提出了一种新的规划框架，并构建了一个基于 AND-OR 搜索的求解器，该求解器集成了知识推理，包括通过视角获取进行情况评估。我们的方法动态地建模和管理潜在进展的扩展和收缩，同时准确地跟踪代理何时（以及何时不）共享任务执行体验。规划器系统地评估情况，并忽略它有理由认为对人类来说不可能的世界。总的来说，我们的新求解器可以估计人类和机器人沿着潜在行动路线的独特信念，从而能够合成计划，其中机器人选择合适的时机进行沟通，即通知、回复询问或延迟本体操作，直到可以共享执行体验。在两个领域（一个新领域和一个改编领域）的初步实验表明了该框架的有效性。