LLM2D

摘要

arXiv:2502.14891v2 宣告类型: replace-cross 摘要：协作三维对象检测在自主驾驶领域具有重要意义，因为它通过促进多智能体之间的信息交换大大提高了每个个体代理的感知能力。然而，在实践中，由于姿态估计误差和时间延迟，智能体之间的信息融合往往会导致空间和时间上的噪声特征表示，从而导致检测错误。扩散模型自然具有将噪声样本转化为理想数据的能力，这促使我们探索使用扩散模型来解决多智能体系统之间的噪声问题。在本文中，我们提出了一种名为CoDiff的新颖鲁棒协作感知框架，该框架利用扩散模型的潜力生成更加全面和清晰的特征表示。据我们所知，这是首次将扩散模型应用于多智能体协作感知。具体而言，我们将高维特征图投影到预先训练的强大自编码器的潜空间中。在这个空间内，每个智能体的信息作为条件来引导扩散模型的采样。这一过程去除了粗糙的特征图并逐步细化融合特征。对模拟数据集和真实世界数据集的实验研究表明，在协作对象检测性能方面，所提出的框架CoDiff始终优于现有的相关方法，并且在智能体的姿态和延迟信息存在高水平噪声时表现出高度期望的鲁棒性。代码已发布在 https://github.com/HuangZhe885/CoDiff