LLM2D
基于决策变换器的作业车间调度问题中神经局部搜索增强方法
Decision Transformer for Enhancing Neural Local Search on the Job Shop Scheduling Problem
作者: Constantin Waubert de Puiseau, Fabian Wolz, Merlin Montag, Jannik Peters, Hasan Tercan, Tobias Meisen
发布日期: 2/5/2025
arXiv ID: 2409.02697

摘要

arXiv:2409.02697v2 公告类型: 替换 摘要: 工厂车间调度问题(JSSP)及其解决方案算法在学术界和工业界已经引起了持续几十年的兴趣。近年来,机器学习(ML)在推进现有和构建新的JSSP启发式解法方面发挥了越来越重要的作用,旨在在更短的计算时间内找到更好的解决方案。本文在最先进的神经局部搜索(NLS)深度强化学习(DRL)代理的基础上进行构建,该代理能够有效地控制JSSP中庞大的局部邻里搜索。特别是,我们开发了一种方法,利用训练过的NLS代理所采取的搜索轨迹训练决策变换器(DT)算法,以进一步改进所学的决策序列。我们的实验表明,DT成功地学习了不同于NLS代理本身的局部搜索策略,在很多情况下,这些策略更为有效。在解决方案质量与可接受的搜索所需计算时间的权衡方面,DT在可以接受较长计算时间的应用场景中表现尤其出色。在这种情况下,它通过每步决策质量的提高,弥补了由于更大型神经网络架构导致的推理时间的增加。因此,DT通过带有ML增强搜索解决了JSSP,达到了最先进的成果。