摘要
arXiv:2503.19699v1 宣告类型: 新
摘要: 在这项研究中,我们将无人机送货问题形式化为一个控制问题,并使用模型预测控制方法解决该问题。进行了两次实验:第一次是在一个较为简单的网格世界环境中进行,该环境的维度较低;第二次则是在具有更高维度和更多复杂性的环境中进行。模型预测控制方法被用来与三种流行的多智能体强化学习(MARL)方法进行基准测试:独立 Q 学习(IQL)、联合行动学习者(JAL)和价值分解网络(VDN)。研究表明,模型预测控制方法能更快地解决问题,并且在实现最小成本和导航最优路径方面所需的最优无人机数量较少。