LLM2D

摘要

arXiv:2411.19517v3 宣布类型: replace-cross 摘要: 混合整数线性规划（MILP）是一种在多个领域广泛使用的优化技术。现有的端到端学习方法为MILP生成一部分决策变量的值，并将剩余问题委托给传统的MILP求解器。然而，这种方法往往因为不准确的预测而无法保证解的有效性（即满足所有约束条件），并且主要关注二元决策变量。满足所有约束条件是获得最优解的前提，对于非二元整数变量（简称为整数变量），有效性的问题更为关键。因此，解决涉及整数变量的MILP的有效性问题至关重要。为解决这些挑战，我们提出了一种新型的基于强化学习（RL）的求解器，不仅可以找到第一个有效解，还可以逐步发现更好的有效解，而无需将剩余部分委托给现成的求解器。我们的实验结果表明，所提出的方法能够达到（接近）最优解。