摘要
交通预测是智慧城市管理的基石,它能够实现高效的资源分配和交通规划。深度学习凭借其捕捉时空数据中复杂非线性模式的能力,已成为交通预测的强大工具。虽然图神经网络 (GCNs) 和基于 Transformer 的模型已展现出潜力,但它们的高计算需求往往阻碍了其在现实世界道路网络中的应用,尤其是那些具有大规模时空交互的网络。为了应对这些挑战,我们提出了一种新颖的时空图 Transformer (STGformer) 架构。STGformer 有效地平衡了 GCNs 和 Transformers 的优势,能够高效地建模全局和局部交通模式,同时保持可控的计算量。与需要多个注意力层的传统方法不同,STG 注意力块能够在单个层中捕捉高阶时空交互,从而显著降低计算成本。具体而言,与 STAEformer 相比,STGformer 在加州道路图(包含 8,600 个传感器)上进行批处理推理时,实现了 100 倍的速度提升和 99.8% 的 GPU 内存使用量减少。我们在 LargeST 基准上评估了 STGformer,并证明了其优于 PDFormer 和 STAEformer 等最先进的基于 Transformer 的方法,这表明 STGformer 有潜力通过克服现有方法的计算和内存限制来彻底改变交通预测,使其成为未来时空建模任务的有前景的基础。