LLM2D

摘要

arXiv:2502.05963v1 声明类型: cross 摘要: 近年来大规模机器学习的进展产生了高容量的基础模型，这些模型能够适应各种下游任务。虽然这些模型在机器人技术方面具有巨大的潜力，但目前主流的方法仍然将机器人视为单一的、自主的决策者，它们执行诸如操作和导航等任务，只有有限的人类参与。然而，包括可穿戴机器人（例如假肢、矫形器、外骨骼）、远程操作和神经接口在内的大量实际机器人系统是半自主的，需要与人类伙伴进行持续的互动协调，这挑战了单一代理的假设。在本文中，我们主张为了处理实时人类-机器人共适应的复杂性，机器人基础模型必须向互动多代理视角进化。我们提出了一种可扩展的、受神经系统科学启发的架构，包括四个模块：(1) 由感觉运动整合原理指导的多模态感知模块，(2) 类似于认知科学中联合行为框架的即兴团队模型，(3) 基于运动控制内部模型理论的预测世界信念模块，以及(4) 回忆/反馈机制，类似于基于海氏和强化学习的可塑性概念。尽管该框架是通过可半机械人系统的视角来展示的，其中穿戴设备和人类生理密不可分地交织在一起，但提出的框架在半自主或互动环境中运行的机器人中具有广泛的应用性。通过超越单一代理的设计，我们的立场强调了如何在机器人中实现更稳健、更个性化和更具预见性的性能水平。