摘要
arXiv:2409.14985v1 公告类型: 交叉 摘要: 在仅依赖LiDAR传感器的情况下,准确检测远距离物体仍然是3D物体检测中的一个关键挑战,这是由于数据稀疏性的固有限制。为了解决这一问题,我们提出了LiDAR-Camera增强网络(LCANet),这是一种新颖的框架,通过融合包含丰富语义信息的2D图像特征来重建LiDAR点云数据,生成额外的点以提高检测精度。LCANet通过将图像特征投影到3D空间中,将LiDAR传感器和摄像机的数据融合在一起,将语义信息整合到点云数据中。然后,这些融合的数据被编码以生成包含语义和空间信息的3D特征,这些特征在边界框预测之前进一步细化以重建最终点。这种融合有效地弥补了LiDAR在检测远距离物体方面的弱点,这些物体通常由稀疏点表示。此外,由于原始数据集中许多物体的稀疏性,使得点生成的有效监督变得困难,我们采用了一个点云完成网络来创建一个完整的点云数据集,该数据集监督我们网络中密集点云的生成。在KITTI和Waymo数据集上的广泛实验表明,LCANet显著优于现有模型,特别是在检测稀疏和远距离物体方面。