摘要
本文介绍了RouteFinder,一个用于解决不同车辆路径规划问题(VRP)变体的综合基础模型框架。我们的核心思想是,VRP的基础模型应该能够通过将每个变体视为配备不同属性的广义问题的子集来表示这些变体。我们提出了一个统一的VRP环境,能够有效地处理任何属性组合。RouteFinder模型利用基于现代Transformer的编码器和全局属性嵌入来改进任务表示。此外,我们引入了两种强化学习技术来增强多任务性能:混合批训练,它能够同时对不同的变体进行训练;以及多变体奖励归一化,以平衡不同的奖励尺度。最后,我们提出了高效的适配器层,能够对具有未见属性的新变体进行微调。在24个VRP变体上的大量实验表明,RouteFinder取得了具有竞争力的结果。我们的代码已公开发布在https://github.com/ai4co/routefinder。