LLM2D
DyTTP:无归一化变换器的轨迹预测
DyTTP: Trajectory Prediction with Normalization-Free Transformers
作者: Yunxiang Liu, Hongkuo Niu
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2504.05356v1

摘要

arXiv:2504.05356v1 交叉公告类型: 摘要:准确的轨迹预测是自动驾驶系统安全运行的基石,理解周围代理的动态行为至关重要。基于Transformer的架构在捕捉复杂的时空依赖关系方面展示出了显著的潜力。然而,它们对归一化层的依赖可能导致计算负担增加和训练不稳定性。在本工作中,我们提出了一种两管齐下的方法来解决这些挑战。首先,我们将DynamicTanh(DyT),这是促进Transformer的最新方法,整合到主干中,取代传统的层归一化。这一修改简化了网络架构并提高了推理的稳定性。我们是首个将DyT部署到轨迹预测任务中的工作。其次,我们采用了快照ensemble策略进一步提升轨迹预测性能。通过使用循环学习率调度,多个模型快照在单次训练运行中被捕捉。这些快照在推理时通过简单的平均聚合,使模型能够从中受益于多样假设,而不会增加显著的额外计算成本。在Argoverse数据集上的大量实验表明,我们综合方法显著提高了预测精度、推理速度和在多种驾驶场景中的鲁棒性。本项工作强调了归一化方法以外的Transformer设计,辅以轻量级ensemble技术,在提升自动驾驶车辆轨迹预测中的潜力。