LLM2D
向量学习可扩展敏捷动态运动规划以实现Robosoccer团队策略优化
Towards Learning Scalable Agile Dynamic Motion Planning for Robosoccer Teams with Policy Optimization
作者: Brandon Ho, Batuhan Altundas, Matthew Gombolay
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05526v1

摘要

arXiv:2502.05526v1 动态轨迹类型: 双语交叉 摘要: 在快速变化的环境中,多智能体系统的动态运动规划,尤其是在存在障碍物的情况下,是一个普遍存在且未解决的问题。无论是从障碍物周围路径规划到机器人手臂的运动,还是在如Robosoccer这样的团队机器人导航场景中计划导航,动态运动规划都需要避免碰撞的同时到达目标目的地,当多个智能体占据同一区域时。在世界变化迅速的连续领域中,现有的经典运动规划算法如RRT*和A*在每一步重新运行时变得计算成本高昂。为了解决这一普遍问题,已经提出了很多经典的和非学习的方法变体,但由于它们在速度、平滑度、最优化等方面的局限性而无法完全解决问题。基于过去的经验适应不同环境的能力,深度学习模型克服了这些挑战。然而,当前的学习运动规划模型使用离散环境,不考虑异质智能体或重新规划,并试图提高经典运动规划器的效率,这导致了可扩展性问题。为了在达到目标位置的同时避免异质团队成员之间的碰撞和与障碍物的碰撞,我们提出了一种基于学习的动态导航模型,并在简单地Robosoccer游戏的概念上展示了该模型在简单环境中的应用。