摘要
arXiv:2411.12150v2 宣布类型: 替换-交叉
摘要: 我们研究了在拥挤且具有互动性的人群中考虑环境约束(如走廊和家具)的机器人导航问题。之前的方法未能考虑到所有类型的行为体与障碍物之间的相互作用,导致机器人路径存在安全隐患且效率低下。在这篇文章中,我们利用crowded和受限场景的图表示,并提出了一个结构化框架来通过深度强化学习学习机器人的导航策略。我们首先将环境各个组件的表示进行分割,并提出了一种异质时空(st)图来建模人类、机器人和障碍物之间不同的相互作用。基于这种异质st图,我们提出了HEIGHT,一个新颖的导航策略网络架构,通过空间和时间来捕捉实体之间的异质相互作用。HEIGHT利用注意力机制来优先考虑重要的相互作用,并利用循环网络来跟踪随着时间变化的动态场景,促使机器人能够适应性地避免碰撞。通过广泛的模拟和现实世界实验,我们展示在具有挑战性的导航场景中,HEIGHT比最先进的基线具有更高的成功性和效率。此外,我们展示了当人群中的人和障碍物密度发生变化时,我们的管道具有比之前的工作更好的零样本泛化能力。更多视频可访问 https://sites.google.com/view/crowdnav-height/home。