摘要
arXiv:2502.02067v1 宣布类型: 交叉
摘要:协助人类的实体代理经常被要求在新的场景中完成一项新的任务。厨房中根据已知食谱准备特定菜肴的代理可能被要求准备新菜肴或在储物间执行清洁任务。由于缺乏足够资源,例如时间或标签示例,可能无法为这些新情况训练代理。大量语言模型(LLMs)在多领域积累了大量知识,能够预测这种新任务和场景的一系列抽象动作,尽管由于任务、代理或领域特定的约束,代理可能无法执行这个动作序列。我们的框架通过利用LLM提供的通用预测和在知识图谱(KG)中编码的先验领域特定知识来解决这些挑战,使代理能够迅速适应新任务和场景。机器人在必要时也会寻求并使用人类输入以完善其现有知识。基于对烹饪和清洁任务在仿真领域的实验评估,我们证明了LLM、KG和人类输入之间的互动相比于仅使用LLM输出带来了显著的性能提升。