LLM2D

摘要

arXiv:2502.14891v1 Announce Type: cross 摘要：协同三维物体检测在自动驾驶领域具有重要意义，因为它能够通过多个代理之间的信息交换极大地增强每个个体代理的感知能力。然而，在实践中，由于姿态估计误差和时间延迟，代理之间的信息融合往往会导致具有空间和时间噪声的特征表示，从而导致检测错误。扩散模型自然具有将嘈杂样本去噪为理想数据的能力，这促使我们探索将扩散模型用于多代理系统之间的去噪问题。在本文中，我们提出了一种新颖的鲁棒协同感知框架 CoDiff，利用扩散模型的潜力来生成更全面和清晰的特征表示。据我们所知，这是首次将扩散模型应用于多代理协同感知。具体来说，我们将高维特征图投影到一个强大的预训练自编码器的潜在空间中。在这个空间中，个体代理信息作为条件来引导扩散模型的采样。该过程去噪粗糙的特征图，并逐步细化融合特征。在模拟和真实世界数据集上的实验研究表明，所提出的框架 CoDiff 在协同物体检测性能方面始终优于现有相关方法，并且在代理的姿态和延迟信息具有较高噪声级别时，展现出了高度期望的鲁棒性。