LLM2D

摘要

构建能够在任何环境中、使用任何物体、运用多种技能完成各种任务的通用机器人一直是人工智能领域的一个长期目标。然而，作为研究群体，我们一直在通过为特定任务设计机器人系统、在特定数据集上训练它们，以及在特定环境中部署它们来限制大多数机器人系统。这些系统需要大量标注数据和特定任务的模型。当部署在现实世界场景中时，这些系统面临着许多泛化问题，并且难以保持对分布变化的鲁棒性。受 NLP 和 CV 等研究领域中网络规模、大容量预训练模型（即基础模型）在开放集性能和内容生成能力方面令人印象深刻的启发，我们致力于探索 (i) 如何将这些来自 NLP 和 CV 的现有基础模型应用于通用机器人领域，以及探索 (ii) 机器人专用基础模型将是什么样子。我们首先提供基础模型在机器人中使用方式的通用公式，以及使通用机器人普遍适用的基本障碍。接下来，我们建立了一个分类法来讨论当前探索利用现有基础模型进行机器人研究并开发针对机器人的基础模型的方式。最后，我们讨论了使用基础模型来实现通用机器人系统的关键挑战和有希望的未来方向。我们鼓励读者查看我们资源的动态 GitHub 库 2，包括本综述中回顾的论文，以及开发用于机器人的基础模型的相关项目和库。