LLM2D

摘要

arXiv:2502.07822v1 交叉类型: cross 摘要: 当前的基于点的目标检测器只能从提供的点中学习，它们的有效感受野有限，对于此类目标缺乏足够的全局学习能力。在本文中，我们提出了一种新的单阶段3D检测的点膨胀机制（PDM-SSD），利用了这两种表示。具体而言，首先使用一种类似PointNet的3D主干网络进行高效的特征编码。然后使用带有点膨胀机制（PDM）的颈部来扩展特征空间，这包括两个关键步骤：点膨胀和特征填充。前者将在欧几里得空间中以采样点为中心的特定大小网格中扩展点。后者则通过球谐系数和高斯密度函数在方向和尺度方面填充未被占据的网格，以便反向传播。接下来，我们关联多个膨胀中心并通过高度压缩获得稀疏网格特征。最后，我们设计了一种混合检测头进行联合学习，一方面预测场景热图来补充投票点集，以提高检测准确性，另一方面通过特征融合校准检测框的目标概率。在具有挑战性的Karlsruhe Institute of Technology和Toyota Technological Institute (KITTI) 数据集上，PDM-SSD 在单模态方法中实现了最先进的多类检测结果，同时推理速度为68帧。我们还通过大量对象级别的实例展示了PDM-SSD在检测稀疏和不完整对象方面的优点。此外，PDM 可以作为辅助网络建立采样点与对象中心之间的联系，从而提高模型的准确性而不牺牲推理速度。我们的代码将在 https://github.com/AlanLiangC/PDM-SSD.git 提供。