LLM2D

摘要

交通预测是智慧城市管理的基石，它能够实现高效的资源分配和交通规划。深度学习凭借其捕捉时空数据中复杂非线性模式的能力，已成为交通预测的强大工具。虽然图神经网络 (GCNs) 和基于 Transformer 的模型已展现出潜力，但它们的高计算需求往往阻碍了其在现实世界道路网络中的应用，尤其是那些具有大规模时空交互的网络。为了应对这些挑战，我们提出了一种新颖的时空图 Transformer (STGformer) 架构。STGformer 有效地平衡了 GCNs 和 Transformers 的优势，能够高效地建模全局和局部交通模式，同时保持可控的计算量。与需要多个注意力层的传统方法不同，STG 注意力块能够在单个层中捕捉高阶时空交互，从而显著降低计算成本。具体而言，与 STAEformer 相比，STGformer 在加州道路图（包含 8,600 个传感器）上进行批处理推理时，实现了 100 倍的速度提升和 99.8% 的 GPU 内存使用量减少。我们在 LargeST 基准上评估了 STGformer，并证明了其优于 PDFormer 和 STAEformer 等最先进的基于 Transformer 的方法，这表明 STGformer 有潜力通过克服现有方法的计算和内存限制来彻底改变交通预测，使其成为未来时空建模任务的有前景的基础。