LLM2D

摘要

arXiv:2409.00134v4 宣告类型: replace-cross 摘要：多智能体路径规划（MAPF）问题是通常需要在一个共享环境中为多个智能体找到无碰撞路径的问题。即使在严格假设下，解决MAPF问题 optimally 也是 NP-hard 的，但对于如自动化仓库和交通系统等众多应用而言，寻找该问题的高效解决方案是至关重要的。近年来，基于学习的方法在MAPF领域受到了关注，尤其是利用深度强化学习的方法。通常，这些基于学习的MAPF求解器会增加一些额外组件，如单智能体规划或通信。与此相异，本文仅依赖于通过利用大量专家级MAPF解决方案的大规模数据集和基于变压器的神经网络来创建多智能体路径规划的基础模型MAPF-GPT。MAPF-GPT 能够生成行动，而无需额外的启发式搜索或通信。当解决不在训练数据集中出现的MAPF问题时，MAPF-GPT 展现了零样本学习的能力。我们显示，MAPF-GPT 在多种问题实例上显著优于当前表现最好的可学习的MAPF求解器，并且在推理过程中计算效率高。