摘要
arXiv:2504.01588v1 类型:交叉学科
摘要:将机器人融入情景教学或体能训练等日常生活场景中,需要具备适应性、社交互动能力和目标导向互动能力的机器人。虽然大型语言模型在人类样式的通信方面表现出很大的潜力,但它们单独使用时受到存储限制和上下文不一致性的阻碍。本文提出了一种多模态、以认知为基础的框架,旨在增强基于大型语言模型的自主决策能力,特别是在社会性和任务导向的人机交互(HRI)中。特别是,我们为机器人教练开发了一个基于大型语言模型的代理,平衡了社交对话、任务指导和目标驱动的激励。为了进一步增强自主性和个性化能力,我们引入了一种记忆系统,用于选择、存储和检索经验,从而基于不同交互过程中积累的知识进行泛化推理。初步的人机交互(HRI)用户研究和使用合成数据集的离线实验验证了我们的方法,展示了该系统能够管理复杂交互、自主驱动训练任务,并构建和检索上下文记忆的能力,推进了智能社交机器人技术的发展。