摘要
arXiv:2502.12484v1 类型: cross
摘要:神经求解器在解决旅行商问题(TSP)方面展示了显著的潜力,但当前的方法面临重大挑战。基于监督学习(SL)的求解器需要大量的高质量标注数据,而基于强化学习(RL)的求解器虽然对数据的依赖较少,但在效率上经常存在不足。为了解决这些限制,我们提出了一种名为LocalEscaper的新颖弱监督学习框架,用于解决大规模TSP问题。LocalEscaper有效地结合了SL和RL的优点,能够在低质量标注的数据集上进行有效的训练。为了进一步提高解决方案的质量,我们引入了一种区域重建策略,该策略解决了现有局部重建方法中常见的局部最优问题。此外,我们提出了一种线性复杂度的注意力机制,减少了计算开销,使大规模TSP的高效求解成为可能,而不会牺牲性能。在合成数据集和真实世界数据集上的实验结果表明,LocalEscaper在性能上超过了现有的神经求解器,取得了最先进的成果。值得一提的是,它为可扩展性和效率设定了新的标杆,能够解决多达50,000个城市的TSP实例。