LLM2D
大型语言模型在具身导航领域的进展:一个综述
Advances in Embodied Navigation Using Large Language Models: A Survey
作者: Jinzhou Lin, Han Gao, Xuxiang Feng, Rongtao Xu, Changwei Wang, Man Zhang, Li Guo, Shibiao Xu
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2311.00530v5

摘要

arXiv:2311.00530v5 宣传类型: 替换 摘要: 近年来,由于在多种实际应用中展现出的巨大潜力,大型语言模型(LLMs)如生成预训练变换器(GPT)取得了快速进步,吸引了越来越多的关注。以具身智能应用为例,LLMs的应用已成为一个重要关注领域。鉴于LLMs在众多应用中的广泛用途,导航任务尤为突出,因为它们要求对环境有深刻的理解,并且需要快速、准确的决策。LLMs可以利用其强大的语言和图像处理能力,增强具身智能系统中的环境感知和决策支持功能。本文对LLMs与具身智能的共生关系进行了详尽的总结,重点在于导航。回顾了最新的模型、研究方法,并评估了现有具身导航模型和数据集的优势和不足。最后,本文基于当前的研究,阐述了LLMs在具身智能中的角色,并预测了该领域未来的发展方向。在本文调查中,关于该领域的研究列表可在 https://github.com/Rongtao-Xu/Awesome-LLM-EN 获取。