摘要
arXiv:2411.19517v3 公告类型: replace-cross
摘要: 整数线性规划(MILP)是一种在各个领域广泛使用的优化技术。现有的端到端学习方法对MILP生成决策变量子集的值,并将剩余问题委托给传统的MILP求解器。然而,由于预测不够准确且主要关注二元决策变量,这种方法往往无法保证解的可行性(即满足所有约束)。满足所有约束是获取最优解的前提,非二元整数(简称整数)变量的问题更加严峻。因此,解决涉及整数变量的MILP的可行性至关重要。为了应对这些挑战,我们提出了一种新的基于强化学习(RL)的求解器,不仅能够找到可行解,还能逐步发现更好的可行解,而无需将剩余部分委托给现成的求解器。我们的实验结果表明,所提出的方法能够实现(接近)最优解。