LLM2D

摘要

arXiv:2503.20241v1 宣布类型: cross 摘要: 物体目标导航（OGN）是机器人和人工智能的基本任务，具有移动机器人图像数据库（MRID）等关键应用。特别是，在未知或动态环境中，无图表示的OGN是必不可少的。本研究旨在通过利用大型语言模型（LLMs）的常识推理能力，增强近期的模块化无图表示OGN系统。具体而言，我们通过将其构架为前沿排名问题来解决基于前沿的探索中确定访问顺序的挑战。我们的方法基于最近的研究发现，尽管LLMs无法确定前沿的绝对值，但在单张视图图像的上下文中评估多个前沿的相对价值方面表现出色。我们通过动态管理前沿列表，利用LLM作为排名模型来添加和删除元素。排名结果以互惠排名向量表示，这非常适合多视图、多查询信息融合。我们通过在Habitat-Sim中的评估验证了我们方法的有效性。