摘要
arXiv:2504.07779v1 宣布类型: 新
摘要: 在现实世界环境中进行动态调度往往难以应对意想不到的中断,使得传统静态调度方法和人工设计的启发式算法显得不足。本文提出了一种创新的方法,将编码遗传编程(GP)与通过强化学习(RL)训练的变压器相结合(GPRT),专门用于解决动态调度场景的复杂性。GPRT 利用变压器来细化由GP生成的启发式算法,同时为GP注入和引导进化。这种双重功能增强了调度启发式算法的适应性和有效性,使其更好地应对现实世界任务的动态性质。通过在集装箱码头卡车调度的实用应用中展示这种集成方法的有效性,GPRT 方法在集装箱码头卡车调度中表现出色,优于传统的GP、独立的变压器方法和其他先进的竞争对手。这项研究的关键贡献在于开发了GPRT方法,展示了将GP与RL相结合以产生稳健和高效的调度解决方案的新颖组合。重要的是,GPRT不仅适用于集装箱港口卡车调度,还提供了一个适用于各种动态调度挑战的多功能框架。其实用性、可解释性以及易修改性使其成为多种现实世界场景中的宝贵工具。