LLM2D

摘要

arXiv:2409.00134v5 宣布类型: replace-cross 摘要：多代理路径规划（MAPF）问题是通常需要在一个共享环境中为多个代理找到无碰撞路径的问题。即使在严格的假设下，优化地解决MAPF问题仍然是NP难的，但这一问题的有效解决方案对于众多应用至关重要，例如自动化仓库和交通系统。近年来，基于学习的MAPF方法受到了关注，特别是那些利用深度强化学习的方法。通常，这样的基于学习的MAPF求解器会增加一些额外组件，如单代理规划或通信。相反，在这项工作中，我们完全依赖于一种模仿学习方法，这种方法利用了一个包含专家MAPF解决方案的大规模数据集和基于变压器的神经网络，以创建一个名为MAPF-GPT的MAPF基础模型。该模型能够生成动作，无需额外的启发式方法或通信。MAPF-GPT在解决不在训练数据集中出现的MAPF问题时展示了零样本学习能力。我们展示了MAPF-GPT在一系列不同问题实例上显著优于当前性能最好的可学习MAPF求解器，并在推理过程中具有计算效率。