LLM2D
一种增强三维物体检测的多模态混合Late-Cascade融合网络
A Multimodal Hybrid Late-Cascade Fusion Network for Enhanced 3D Object Detection
作者: Carlo Sgaravatti, Roberto Basla, Riccardo Pieroni, Matteo Corno, Sergio M. Savaresi, Luca Magri, Giacomo Boracchi
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.18419v1

摘要

arXiv:2504.18419v1 Announce Type: 跨领域 摘要: 我们提出了一种新的方法,利用多模态输入从LiDAR和RGB摄像头检测3D物体,采用一种结合了RGB检测网络和3D LiDAR探测器的混合晚融方案。我们利用晚融原则减少LiDAR的假阳性检测,通过将LiDAR边界框投影到图像上来匹配LiDAR和RGB检测结果。我们依赖级联融合原则利用视图之间RGB检测生成的极线约束和锥体,恢复LiDAR的假阴性检测。我们的解决方案可以堆叠在任何底层单模态检测器之上,使训练过程具有灵活性,可以利用预训练的LiDAR和RGB检测器,或单独训练两个分支。我们在KITTI物体检测基准上评估了我们的结果,显示出显著的性能提升,尤其是在行人和骑行者检测方面。