摘要
准确检测远距离的物体在依靠仅有的LiDAR传感器进行3D物体检测时仍是一个关键挑战,因为数据稀疏性固有的限制。为了解决这个问题,我们提出了LiDAR-相机增强网络(LCANet),这是一种通过融合包含丰富语义信息的2D图像特征来重建LiDAR点云数据的创新框架,从而生成额外的点以提高检测精度。LCANet通过将图像特征投影到3D空间来融合来自LiDAR传感器和相机的数据,将语义信息整合到点云数据中。然后对这些融合的数据进行编码,生成同时包含语义和空间信息的3D特征,这些特征进一步被优化以在边界框预测之前重建最终的点。这种融合有效地弥补了LiDAR在检测远距离物体时的弱点,因为这些物体通常由稀疏的点表示。此外,由于原始数据集中许多物体的稀疏性使得点生成的有效监督具有挑战性,我们采用点云补全网络来创建一个完整的点云数据集,以监督我们网络中稠密点云的生成。在KITTI和Waymo数据集上的大量实验表明,LCANet在检测稀疏和远距离物体方面显著优于现有模型。