LLM2D
大型语言模型具身化和社会化基础的路线图
A Roadmap for Embodied and Social Grounding in LLMs
作者: Sara Incao, Carlo Mazzola, Giulia Belgiovine, Alessandra Sciutti
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16900v1

摘要

大型语言模型 (LLM) 与机器人系统的融合为机器人领域带来了变革性的范式,不仅在通信领域提供了前所未有的能力,还在多模态输入处理、高级推理和计划生成等技能方面做出了贡献。将 LLM 的知识融入现实世界被认为是利用 LLM 在机器人领域效率的关键途径。然而,仅仅通过多模态方法或机器人本体将 LLM 的表征连接到外部世界还不足以让它们理解其所操纵的语言的含义。受人类启发,这项工作着眼于代理人掌握和体验世界的三个必要要素。将 LLM 融入现实世界的路线图被设想为一个积极的躯体系统,作为体验环境的参考点,一个时间结构化的体验,用于与外部世界进行连贯的、自我相关的交互,以及社交技能,以获得共同的基础共享体验。