LLM2D
一种增强图深层强化学习框架,用于解决航空降落问题
A Graph-Enhanced Deep-Reinforcement Learning Framework for the Aircraft Landing Problem
作者: Vatsal Maru
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.12617v1

摘要

arXiv:2502.12617v1 宣告类型: cross 摘要:飞机着陆问题是航空运输和管理中面临的挑战性问题之一。挑战在于按照顺序安排到达的飞机,以优化成本和延误。解决这个问题的方法多种多样,大多数基于运筹学算法和元启发式方法。尽管传统方法在某些因素上表现更佳,但在解决实时重新调度和计算可扩展性方面仍存在问题。本文提出了一个新颖的深度强化学习(DRL)框架,该框架结合了图神经网络与演员-评论家架构,以解决飞机着陆问题(ALP)。本文介绍了三个关键贡献:基于图的状态表示,能够高效地捕捉飞机之间的时空关系;一种专门设计的演员-评论家架构,用于处理着陆调度中的多个竞争性目标;以及一种跑道平衡策略,确保高效利用资源的同时满足安全约束。实验结果表明,训练后的算法在不同问题集上进行测试后,结果与运筹学算法具有竞争力。在标准基准数据集上的实验结果表明,与混合整数规划(MIP)相比,计算时间减少了99.95%,与先来先服务(FCFS)方法相比,跑道通过量提高了38%。因此,提出的解决方案与传统方法具有竞争力,并实现了显著的进展。值得注意的是,该方法不需要重新训练,使其特别适合工业部署。该框架在一秒内生成解的能力能够实现实时重新调度,满足空中交通管理的关键要求。