LLM2D

摘要

arXiv:2505.06997v1 通知类型: 新摘要: 移动群众感知超越了传统的以人类为中心的模型，将无人机（UAV）和无人地面车辆（UGV）等异构实体整合在一起。在复杂环境、有限通信和部分可观测性的挑战性紧急救援场景中，这些多样化的代理之间的任务分配优化至关重要。本文专门针对紧急救援场景，考虑了人类、无人机和无人地面车辆的情况下，解决了异构实体协作感知任务分配（HECTA）问题。我们引入了一种新的“硬合作”策略，其中无人地面车辆优先为低电量无人机充电，同时执行其感知任务。主要目标是在严格的时间限制下最大化任务完成率（TCR）。我们严格地将这个NP难问题形式化为去中心化的部分可观测马尔可夫决策过程（Dec-POMDP），以有效地处理不确定性下的顺序决策。为了解决这个问题，我们提出了一种名为HECTA4ER的新多智能体强化学习算法，基于集中训练与分散执行的架构。HECTA4ER包括定制设计的功能，包括复杂的特征提取模块，利用隐藏状态的历史动作观察，以及一个整合全局和本地信息的混合网络，特别应对部分可观测性的挑战。此外，理论分析确认了该算法的收敛性质。广泛的仿真表明，HECTA4ER显著优于基线算法，平均提升了18.42%的TCR。更重要的是，现实世界的案例研究验证了该算法在动态感知场景下的有效性和稳健性，强调了其在紧急响应中的实际应用潜力。