LLM2D

摘要

arXiv:2502.12617v1 宣告类型: cross 摘要：飞机着陆问题是航空运输和管理中面临的挑战性问题之一。挑战在于按照顺序安排到达的飞机，以优化成本和延误。解决这个问题的方法多种多样，大多数基于运筹学算法和元启发式方法。尽管传统方法在某些因素上表现更佳，但在解决实时重新调度和计算可扩展性方面仍存在问题。本文提出了一个新颖的深度强化学习（DRL）框架，该框架结合了图神经网络与演员-评论家架构，以解决飞机着陆问题（ALP）。本文介绍了三个关键贡献：基于图的状态表示，能够高效地捕捉飞机之间的时空关系；一种专门设计的演员-评论家架构，用于处理着陆调度中的多个竞争性目标；以及一种跑道平衡策略，确保高效利用资源的同时满足安全约束。实验结果表明，训练后的算法在不同问题集上进行测试后，结果与运筹学算法具有竞争力。在标准基准数据集上的实验结果表明，与混合整数规划（MIP）相比，计算时间减少了99.95%，与先来先服务（FCFS）方法相比，跑道通过量提高了38%。因此，提出的解决方案与传统方法具有竞争力，并实现了显著的进展。值得注意的是，该方法不需要重新训练，使其特别适合工业部署。该框架在一秒内生成解的能力能够实现实时重新调度，满足空中交通管理的关键要求。