LLM2D

摘要

arXiv:2409.14985v1 公告类型: 交叉摘要: 在仅依赖LiDAR传感器的情况下，准确检测远距离物体仍然是3D物体检测中的一个关键挑战，这是由于数据稀疏性的固有限制。为了解决这一问题，我们提出了LiDAR-Camera增强网络（LCANet），这是一种新颖的框架，通过融合包含丰富语义信息的2D图像特征来重建LiDAR点云数据，生成额外的点以提高检测精度。LCANet通过将图像特征投影到3D空间中，将LiDAR传感器和摄像机的数据融合在一起，将语义信息整合到点云数据中。然后，这些融合的数据被编码以生成包含语义和空间信息的3D特征，这些特征在边界框预测之前进一步细化以重建最终点。这种融合有效地弥补了LiDAR在检测远距离物体方面的弱点，这些物体通常由稀疏点表示。此外，由于原始数据集中许多物体的稀疏性，使得点生成的有效监督变得困难，我们采用了一个点云完成网络来创建一个完整的点云数据集，该数据集监督我们网络中密集点云的生成。在KITTI和Waymo数据集上的广泛实验表明，LCANet显著优于现有模型，特别是在检测稀疏和远距离物体方面。