LLM2D

摘要

arXiv:2502.00767v1 公告类型：交叉摘要：深度学习在解决欧几里得旅行商问题（TSP）等组合优化问题方面显示出显著的潜力。然而，现有TSP算法的大多数训练和测试实例都是从特定的分布（如均匀分布）中随机生成的。这导致了对深度学习算法在离分布外（OOD）泛化场景中的性能分析和理解不足，这些场景与组合优化领域的最坏情况性能密切相关。对于数据驱动的算法而言，随机生成数据集的统计属性至关重要。本研究构建了一种名为最近邻密度的统计量，用于验证随机生成数据集的渐近性质，并揭示基于学习的求解器的贪婪行为，即总是选择最近邻节点来构建解路径。基于这种统计量，我们开发了依赖于分布转移或实例扰动的可解释的数据增强方法，并验证了基于学习的求解器在增强数据上的性能明显下降。此外，使用增强数据微调基于学习的求解器进一步增强了它们的泛化能力。总之，我们揭示了基于学习的TSP求解器存在过度贪婪的局限性，这可能对AI赋能的组合优化求解器具有深远的影响。