LLM2D
Starjob: 由大规模语言模型驱动的车间调度数据集
Starjob: Dataset for LLM-Driven Job Shop Scheduling
作者: Henrik Abgaryan, Tristan Cazenave, Ararat Harutyunyan
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.01877v2

摘要

arXiv:2503.01877v2 宣告类型: 替换-交叉 摘要:大规模语言模型(LLMs)已经在各个领域展示了惊人的能力,但它们在解决组合优化问题方面的潜力仍然 largely unexplored。在本论文中,我们研究了LLMs在作业车间调度问题(JSSP)中的适用性,这是一个组合优化的经典难题,需要对任务进行高效的机器分配以最小化完工时间。为此,我们介绍了 Starjob,这是首个专门为训练LLMs设计的监督数据集,包含130,000个实例。利用这个数据集,我们使用LoRA方法对经过8位量化处理的LLaMA 8B模型进行微调,以开发端到端的调度方法。在标准基准上的评估结果表明,所提出基于LLM的方法不仅超越了传统的优先级调度规则(PDRs),还超过了最先进的神经方法如L2D,在DMU基准上的平均改进率为15.36%,在Taillard基准上的改进率为7.85%。这些结果突显了LLMs在解决组合优化问题方面未充分利用的潜力,为未来在这个领域的进步铺平了道路。