LLM2D

摘要

arXiv:2409.02697v2 公告类型: 替换摘要: 工厂车间调度问题（JSSP）及其解决方案算法在学术界和工业界已经引起了持续几十年的兴趣。近年来，机器学习（ML）在推进现有和构建新的JSSP启发式解法方面发挥了越来越重要的作用，旨在在更短的计算时间内找到更好的解决方案。本文在最先进的神经局部搜索（NLS）深度强化学习（DRL）代理的基础上进行构建，该代理能够有效地控制JSSP中庞大的局部邻里搜索。特别是，我们开发了一种方法，利用训练过的NLS代理所采取的搜索轨迹训练决策变换器（DT）算法，以进一步改进所学的决策序列。我们的实验表明，DT成功地学习了不同于NLS代理本身的局部搜索策略，在很多情况下，这些策略更为有效。在解决方案质量与可接受的搜索所需计算时间的权衡方面，DT在可以接受较长计算时间的应用场景中表现尤其出色。在这种情况下，它通过每步决策质量的提高，弥补了由于更大型神经网络架构导致的推理时间的增加。因此，DT通过带有ML增强搜索解决了JSSP，达到了最先进的成果。