LLM2D

摘要

arXiv:2412.05313v5 通知类型: replace-cross 摘要：高效地学习和执行长期时滞的移动操作（MoMa）任务对于促进家庭和工作场所的机器人技术至关重要。然而，当前的MoMa模型在数据使用上效率低下，强调了需要改进的模型，这些模型需要现实规模的基准来评估其效率，而这样的基准目前并不存在。为了解决这个问题，我们引入了LAMBDA（λ）基准（Long-horizon Actions for Mobile-manipulation Benchmarking of Directed Activities），该基准使用可管理大小的数据集评估模型在语言条件下的长期时滞、多房间、多楼层、拣选和放置任务上的数据效率性，这些数据更容易收集。基准数据集包含571个人工收集的演示，为模拟和真实世界的设置提供了真实性和多样性。与规划器生成的数据不同，这些轨迹提供了自然的变异性并支持回放验证，确保了稳健的学习和评估。我们对多种模型进行了基准测试，包括基于学习的模型和结合了基础模型与任务和运动规划的神经符号模块方法。基于学习的方法即使利用预训练权重，成功率也表现出次优，突显出了显著的数据效率性问题。然而，神经符号方法在数据效率性方面表现更好。研究结果强调了需要更数据高效的基于学习的MoMa方法。λ通过成为未来模型评估数据效率性的重要基准来解决这一缺口，这些未来模型在处理家庭机器人任务时能够更好地处理。