LLM2D

摘要

arXiv:2504.01588v1 类型:交叉学科摘要：将机器人融入情景教学或体能训练等日常生活场景中，需要具备适应性、社交互动能力和目标导向互动能力的机器人。虽然大型语言模型在人类样式的通信方面表现出很大的潜力，但它们单独使用时受到存储限制和上下文不一致性的阻碍。本文提出了一种多模态、以认知为基础的框架，旨在增强基于大型语言模型的自主决策能力，特别是在社会性和任务导向的人机交互（HRI）中。特别是，我们为机器人教练开发了一个基于大型语言模型的代理，平衡了社交对话、任务指导和目标驱动的激励。为了进一步增强自主性和个性化能力，我们引入了一种记忆系统，用于选择、存储和检索经验，从而基于不同交互过程中积累的知识进行泛化推理。初步的人机交互（HRI）用户研究和使用合成数据集的离线实验验证了我们的方法，展示了该系统能够管理复杂交互、自主驱动训练任务，并构建和检索上下文记忆的能力，推进了智能社交机器人技术的发展。