LLM2D

摘要

arXiv:2502.19694v2 通告类型: 交叉替换摘要：鸟瞰图（BEV）表示在自动驾驶任务中起着关键作用。尽管在BEV生成方面取得了近期进展，但源自传感器限制和学习过程的固有噪声依然未得到充分解决，导致次优的BEV表示，从而负面影响了下游任务的性能。为了解决这一问题，我们提出了BEVDiffuser，这是一种新型扩散模型，利用真实物体布局作为指导有效地去噪BEV特征图。BEVDiffuser可以在训练期间以即插即用的方式操作，增强现有的BEV模型而无需任何架构上的修改。在具有挑战性的nuScenes数据集上的大量实验表明，BEVDiffuser具有出色的去噪和生成能力，能够显著增强现有BEV模型的表现，如在无额外计算复杂度的情况下，3D物体检测的mAP提升12.3%，NDS提升10.1%。此外，在长尾物体检测以及在恶劣天气和照明条件下仍显示出显著的性能改进，进一步验证了BEVDiffuser在去噪和增强BEV表示方面的有效性。