摘要
arXiv:2501.02977v2 宣传类型:替换-交叉
摘要:概况化的车辆路径问题(PVRP)是异质容量车辆路径问题(HCVRP)的一般化形式,其中的目标是在不同的车辆概况下优化车辆的路径,以满足客户的各种需求,每个客户的偏好或约束条件各不相同。虽然现有的学习方法在解决HCVRP的实时问题上显示出潜力,但尚未有学习方法可以解决更实际和具有挑战性的PVRP。本文中,我们提出了一种综合性注意力模型带概况(CAMP),这是一种使用多智能体强化学习学习PVRP高效解算器的新方法。CAMP 使用专门的基于注意力的编码器架构,在每个车辆概况下并行嵌入概况化的客户表示。我们设计了一个智能体之间的通信层,以便在解码的每一步中进行跨概况化嵌入的合作决策,并使用批量指针机制关注概况化嵌入以评估下一步动作的可能性。我们在两种PVRP变体上评估了CAMP:具有偏好的PVRP,其显式地影响奖励函数,以及具有区城约束的PVRP,具有不同数量的智能体和客户,展示了我们的学习解算器在解决质量与计算效率方面与经典的最先进的神经多智能体模型相比取得了竞争力的结果。我们将在 https://github.com/ai4co/camp 开放代码供参考。