摘要
arXiv:2504.08195v1 交叉类型
摘要:在涉及服务分布式目标点的应用中,如灾害响应、环境监测和 surveillance,多架合作式自主无人机的航迹规划是一项挑战,尤其是在部分可观测性、有限通信范围和不确定环境下的情况。传统的路径规划算法在这些场景中遇到困难,特别是在没有先验信息的情况下。为了解决这些挑战,我们提出了一种新的框架,该框架结合了图神经网络(GNN)、深度强化学习(DRL)和基于变换器的机制,以增强多agent协调和集体任务执行。我们的方法利用GNN通过自适应图构建来建模agent-agent和agent-goal交互,从而在受限通信条件下实现高效的 정보聚合和决策。一种基于变换器的消息传递机制,结合边特征增强注意力,捕获复杂交互模式,同时,一种双重深度Q网络(Double DQN)配以优先经验重放优化agent策略,以适应部分可观测环境。这种集成专门设计以解决多agent导航的特定要求,如可扩展性、适应性和高效的任务执行。实验结果表明,与粒子群优化(PSO)、贪婪算法和DQN等基准方法相比,我们的方法在每回合平均步骤减少到200步的同时,服务提供率达到90%,网格覆盖率达到100%(节点发现)。