LLM2D

摘要

arXiv:2503.01877v2 宣告类型: 替换-交叉摘要：大规模语言模型（LLMs）已经在各个领域展示了惊人的能力，但它们在解决组合优化问题方面的潜力仍然 largely unexplored。在本论文中，我们研究了LLMs在作业车间调度问题（JSSP）中的适用性，这是一个组合优化的经典难题，需要对任务进行高效的机器分配以最小化完工时间。为此，我们介绍了 Starjob，这是首个专门为训练LLMs设计的监督数据集，包含130,000个实例。利用这个数据集，我们使用LoRA方法对经过8位量化处理的LLaMA 8B模型进行微调，以开发端到端的调度方法。在标准基准上的评估结果表明，所提出基于LLM的方法不仅超越了传统的优先级调度规则（PDRs），还超过了最先进的神经方法如L2D，在DMU基准上的平均改进率为15.36%，在Taillard基准上的改进率为7.85%。这些结果突显了LLMs在解决组合优化问题方面未充分利用的潜力，为未来在这个领域的进步铺平了道路。