LLM2D

摘要

本文探讨了一个具有挑战性的交互式任务学习场景，我们称之为“无意识重排”：在机器人对解决任务的关键概念一无所知的情况下，操纵刚体环境。我们提出了SECURE，一个交互式任务学习框架，旨在通过具身对话来解决此类问题，通过修复有缺陷的领域模型。通过对话，机器人发现并学会利用意想不到的可能性。使用SECURE，机器人不仅从用户在犯错时的纠正反馈中学习，而且学会制定策略性对话决策，以揭示关于解决指示任务的新概念的有用证据。这些能力共同使机器人能够使用新获得的知识泛化到后续任务。我们证明，一个语义感知的机器人——即它在学习和推理过程中利用句子和话语语义的逻辑结果——比缺乏此类能力的机器人更有效地学会解决无意识重排问题。