LLM2D

摘要

arXiv:2505.00935v1 类别:交叉摘要：计算能力的增加和深度学习革命使得在人工智能研究中探索新的话题和前沿成为可能。一种名为具身人工智能的新领域，它将计算机视觉、机器人学和决策制定相交，近年来逐渐变得重要，因为它旨在促进智能自主机器人的开发，并将其部署到社会中。近年来，大规模的3D模型集合的可用性使得在固定帧数下快速且安全地训练基于学习的代理，并在将其部署到真实的机器人平台上之前仔细评估它们的行为成为可能。这些智能代理旨在在一个可能未知的环境中执行特定任务。为此，在模拟训练期间，代理学会进行连续与周围环境的互动，如从环境中收集信息、编码和提取有助于任务的有用线索，并朝着最终目标执行动作；其中代理的每一步行动都会影响这些互动。本论文遵循了从概念到实现再到部署的具身代理在室内环境中的完整创作过程。我们旨在为具身人工智能和自主代理领域的研究做出贡献，以促进该领域未来的工作。我们详细分析了实施智能具身代理背后的过程，理解了当前文献的详细状态，解释了所提方法的技术细节，并对相关机器人任务进行了精确的实验研究。