LLM2D

摘要

arXiv:2411.19517v3 公告类型: replace-cross 摘要: 整数线性规划（MILP）是一种在各个领域广泛使用的优化技术。现有的端到端学习方法对MILP生成决策变量子集的值，并将剩余问题委托给传统的MILP求解器。然而，由于预测不够准确且主要关注二元决策变量，这种方法往往无法保证解的可行性（即满足所有约束）。满足所有约束是获取最优解的前提，非二元整数（简称整数）变量的问题更加严峻。因此，解决涉及整数变量的MILP的可行性至关重要。为了应对这些挑战，我们提出了一种新的基于强化学习（RL）的求解器，不仅能够找到可行解，还能逐步发现更好的可行解，而无需将剩余部分委托给现成的求解器。我们的实验结果表明，所提出的方法能够实现（接近）最优解。