LLM2D
语义智能:将GPT-4与规划集成到低成本机器人中
Semantic Intelligence: Integrating GPT-4 with A Planning in Low-Cost Robotics
作者: Jesse Barkley, Abraham George, Amir Barati Farimani
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.01931v1

摘要

arXiv:2505.01931v1 交叉公告类型 摘要:传统的机器人导航通常依赖于硬编码的状态机和纯粹的几何路径规划者,限制了机器人解释高级语义指令的能力。在这篇论文中,我们首先评估了GPT-4作为路径规划者的表现与A*算法相比如何,然后提出了一种结合GPT-4语义推理与A*算法的混合规划框架,该框架运行在ROS2 Humble上的低成本机器人平台上。我们的方法通过使用基于提示的GPT-4推理来处理任务逻辑,从而消除了显式的有限状态机(FSM)编码,同时保持了A*计算的准确路径。GPT-4模块提供了对指令和环境线索的语义理解(例如,识别有毒障碍物或拥挤区域以避免,或理解低电量情况需要选择备选路线),并通过障碍缓冲动态调整机器人的占用网格,以强制执行语义约束。我们展示了对于序列任务的多步推理,例如首先导航到资源目标,然后安全地到达最终目的地。通过在配备顶部摄像头和树莓派Zero 2W的Petoi Bittle机器人上进行实验,将经典的A*算法与GPT-4辅助的规划进行了比较。结果显示,虽然A*在基础路线生成和避障方面更快更准确,但集成GPT-4的系统在纯几何规划者无法解决的语义任务上实现了高达96-100%的成功率。这项工作突显了通过利用大型语言模型推理,低成本机器人可以表现出智能且具有上下文意识的行为,而无需大量硬件和微调。