LLM2D

摘要

实时动态调度是现代制造过程中一项至关重要但极其复杂的任务，因其高决策复杂性而备受挑战。近年来，强化学习（RL）作为一种有效应对这一挑战的技术，逐渐受到关注。然而，传统的RL方法通常依赖于人工制定的调度规则，不适用于大规模工厂范围内的调度。为了填补这一空白，本文将领导者-跟随者多智能体强化学习（MARL）概念应用于调度问题，通过将调度问题分解为一系列子问题，由每个智能体分别处理，以实现可扩展性。我们进一步通过提出一种基于规则的转换算法来强化这一过程，以防止因智能体错误导致的生产能力灾难性损失。实验结果表明，所提出的模型在多个方面优于最先进的基于深度RL的调度模型。此外，该模型在应对需求变化时表现出最强的调度鲁棒性。总体而言，所提出的基于MARL的调度模型为实时调度问题提供了一种有前景的解决方案，具有在各种制造业中应用的潜力。