LLM2D
可扩展的多智能体强化学习在工厂级动态调度中的应用
Scalable Multi-agent Reinforcement Learning for Factory-wide Dynamic Scheduling
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13571v1

摘要

实时动态调度是现代制造过程中一项至关重要但极其复杂的任务,因其高决策复杂性而备受挑战。近年来,强化学习(RL)作为一种有效应对这一挑战的技术,逐渐受到关注。然而,传统的RL方法通常依赖于人工制定的调度规则,不适用于大规模工厂范围内的调度。为了填补这一空白,本文将领导者-跟随者多智能体强化学习(MARL)概念应用于调度问题,通过将调度问题分解为一系列子问题,由每个智能体分别处理,以实现可扩展性。我们进一步通过提出一种基于规则的转换算法来强化这一过程,以防止因智能体错误导致的生产能力灾难性损失。实验结果表明,所提出的模型在多个方面优于最先进的基于深度RL的调度模型。此外,该模型在应对需求变化时表现出最强的调度鲁棒性。总体而言,所提出的基于MARL的调度模型为实时调度问题提供了一种有前景的解决方案,具有在各种制造业中应用的潜力。