LLM2D

摘要

arXiv:2504.05356v1 交叉公告类型：摘要：准确的轨迹预测是自动驾驶系统安全运行的基石，理解周围代理的动态行为至关重要。基于Transformer的架构在捕捉复杂的时空依赖关系方面展示出了显著的潜力。然而，它们对归一化层的依赖可能导致计算负担增加和训练不稳定性。在本工作中，我们提出了一种两管齐下的方法来解决这些挑战。首先，我们将DynamicTanh（DyT），这是促进Transformer的最新方法，整合到主干中，取代传统的层归一化。这一修改简化了网络架构并提高了推理的稳定性。我们是首个将DyT部署到轨迹预测任务中的工作。其次，我们采用了快照ensemble策略进一步提升轨迹预测性能。通过使用循环学习率调度，多个模型快照在单次训练运行中被捕捉。这些快照在推理时通过简单的平均聚合，使模型能够从中受益于多样假设，而不会增加显著的额外计算成本。在Argoverse数据集上的大量实验表明，我们综合方法显著提高了预测精度、推理速度和在多种驾驶场景中的鲁棒性。本项工作强调了归一化方法以外的Transformer设计，辅以轻量级ensemble技术，在提升自动驾驶车辆轨迹预测中的潜力。