LLM2D

摘要

arXiv:2502.12484v1 类型: cross 摘要：神经求解器在解决旅行商问题(TSP)方面展示了显著的潜力，但当前的方法面临重大挑战。基于监督学习(SL)的求解器需要大量的高质量标注数据，而基于强化学习(RL)的求解器虽然对数据的依赖较少，但在效率上经常存在不足。为了解决这些限制，我们提出了一种名为LocalEscaper的新颖弱监督学习框架，用于解决大规模TSP问题。LocalEscaper有效地结合了SL和RL的优点，能够在低质量标注的数据集上进行有效的训练。为了进一步提高解决方案的质量，我们引入了一种区域重建策略，该策略解决了现有局部重建方法中常见的局部最优问题。此外，我们提出了一种线性复杂度的注意力机制，减少了计算开销，使大规模TSP的高效求解成为可能，而不会牺牲性能。在合成数据集和真实世界数据集上的实验结果表明，LocalEscaper在性能上超过了现有的神经求解器，取得了最先进的成果。值得一提的是，它为可扩展性和效率设定了新的标杆，能够解决多达50,000个城市的TSP实例。