摘要
arXiv:2503.20205v1 宣布类型: cross
摘要:适当的交通状态表示对于学习交通信号控制策略至关重要。然而,目前大多数交通状态表示都是基于启发式设计,缺乏足够的理论支持。在本文中,我们(1)开发了一种灵活、高效且具有理论依据的方法,即广义相位压力(G2P)控制,该方法仅考虑简单的车道特征来决定哪个相位需要执行;(2)基于排队理论,将压力控制理论扩展到基于多同质车道道路网络的一般形式;(3)设计了一种新的交通状态表示,基于G2P控制的广义相位状态特征;(4)通过将广义相位状态表示与MPLight和CoLight两种性能良好的基于强化学习(RL)的交通信号控制策略学习方法相结合,开发了一种基于RL的算法模板G2P-XLight,以及两种新的RL算法G2P-MPLight和G2P-CoLight。在多个真实世界数据集上的广泛实验表明,G2P控制在交通运输领域优于当前最先进的启发式方法和其他最近的人工设计启发式方法;而新提出的G2P-XLight显著优于最先进的基于学习的方法。我们的代码已在线提供。