摘要
arXiv:2407.18892v2 宣告类型: replace-cross
摘要:在大规模或杂乱环境中自主机器人探索仍然是智能车辆应用中的一个核心挑战,其中部分或缺失的先验地图限制了可靠导航。本文介绍了FH-DRL,这是一种新颖的框架,它将可定制的启发式函数与双延迟DDPG(TD3)代理相结合,用于连续、高速的局部导航。提出的启发式函数依赖于指数-双曲距离评分,该评分平衡了即时接近性与远程探索收益之间的关系,并使用基于占用率的随机度量来实时计算环境的开放性和障碍密度。通过使用这些自适应度量对前沿进行排序,FH-DRL 目标是既高度信息性又具操作性的航点,从而最小化冗余路径和总探索时间。我们全面评估了FH-DRL在多个模拟和现实场景中的性能,证明其在旅行距离和完成时间方面的表现优于仅基于前沿或纯粹基于DRL的探索方法。在结构化的走廊布局和迷宫样拓扑结构中,我们的架构始终优于标准方法,如最近前沿、认知前沿探索和目标驱动自主探索。使用Turtlebot3平台的实际测试进一步证实了其在未见或杂乱室内空间中的鲁棒适应性。结果强调了FH-DRL作为一种有效且可推广的方法,在大型或部分已知环境中的前沿基探索方面的优势,为各类自主驾驶、工业和服务机器人任务提供了有前景的方向。