LLM2D

摘要

arXiv:2504.08195v1 交叉类型摘要：在涉及服务分布式目标点的应用中，如灾害响应、环境监测和 surveillance，多架合作式自主无人机的航迹规划是一项挑战，尤其是在部分可观测性、有限通信范围和不确定环境下的情况。传统的路径规划算法在这些场景中遇到困难，特别是在没有先验信息的情况下。为了解决这些挑战，我们提出了一种新的框架，该框架结合了图神经网络（GNN）、深度强化学习（DRL）和基于变换器的机制，以增强多agent协调和集体任务执行。我们的方法利用GNN通过自适应图构建来建模agent-agent和agent-goal交互，从而在受限通信条件下实现高效的 정보聚合和决策。一种基于变换器的消息传递机制，结合边特征增强注意力，捕获复杂交互模式，同时，一种双重深度Q网络（Double DQN）配以优先经验重放优化agent策略，以适应部分可观测环境。这种集成专门设计以解决多agent导航的特定要求，如可扩展性、适应性和高效的任务执行。实验结果表明，与粒子群优化（PSO）、贪婪算法和DQN等基准方法相比，我们的方法在每回合平均步骤减少到200步的同时，服务提供率达到90%，网格覆盖率达到100%（节点发现）。