LLM2D
面向高效室外物体导航的不可见推理
Reasoning about the Unseen for Efficient Outdoor Object Navigation
作者: Quanting Xie, Tianyi Zhang, Kedi Xu, Matthew Johnson-Roberson, Yonatan Bisk
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2309.10103v2

摘要

机器人应该存在于人类存在的任何地方:室内、室外,甚至未经映射的环境。相比之下,最近在目标导向导航 (OGN) 方面的进展集中在利用室内环境的时空线索进行导航,这些线索无法推广到室外环境。尽管这些贡献为室内场景提供了宝贵的见解,但更广泛的现实世界机器人应用通常扩展到室外环境。当我们过渡到广阔而复杂的外界环境时,新的挑战随之而来。与室内环境的结构化布局不同,室外环境缺乏清晰的空间界限,并且充满了固有的语义歧义。尽管如此,人类能够轻松地进行导航,因为我们可以推断未见过的东西。我们引入了一项新任务 OUTDOOR,一种新的机制,用于让大型语言模型 (LLMs) 准确地幻化可能出现的未来,以及一种新的计算感知成功指标,用于推动该领域更复杂的研究。此外,我们在模拟无人机和室外环境中的物理四足动物上展示了令人印象深刻的结果。我们的代理没有预先映射,我们的形式主义优于基于 LLM 的朴素方法。