摘要
arXiv:2411.19517v3 宣布类型: replace-cross
摘要: 混合整数线性规划(MILP)是一种在多个领域广泛使用的优化技术。现有的端到端学习方法为MILP生成一部分决策变量的值,并将剩余问题委托给传统的MILP求解器。然而,这种方法往往因为不准确的预测而无法保证解的有效性(即满足所有约束条件),并且主要关注二元决策变量。满足所有约束条件是获得最优解的前提,对于非二元整数变量(简称为整数变量),有效性的问题更为关键。因此,解决涉及整数变量的MILP的有效性问题至关重要。为解决这些挑战,我们提出了一种新型的基于强化学习(RL)的求解器,不仅可以找到第一个有效解,还可以逐步发现更好的有效解,而无需将剩余部分委托给现成的求解器。我们的实验结果表明,所提出的方法能够达到(接近)最优解。