摘要
本文探讨了一个具有挑战性的交互式任务学习场景,我们称之为“无意识重排”:在机器人对解决任务的关键概念一无所知的情况下,操纵刚体环境。我们提出了SECURE,一个交互式任务学习框架,旨在通过具身对话来解决此类问题,通过修复有缺陷的领域模型。通过对话,机器人发现并学会利用意想不到的可能性。使用SECURE,机器人不仅从用户在犯错时的纠正反馈中学习,而且学会制定策略性对话决策,以揭示关于解决指示任务的新概念的有用证据。这些能力共同使机器人能够使用新获得的知识泛化到后续任务。我们证明,一个语义感知的机器人——即它在学习和推理过程中利用句子和话语语义的逻辑结果——比缺乏此类能力的机器人更有效地学会解决无意识重排问题。