摘要
arXiv:2411.03672v2 宣告类型: replace-cross
摘要:语义场景补全(SSC)对于实现自动驾驶系统的全面感知至关重要。然而,现有的SSC方法往往忽略了实际应用中的高部署成本。传统的架构,如3D卷积神经网络(3D CNNs)和自我注意机制,在有效地捕捉3D体素网格内的长程依赖关系方面面临挑战,限制了它们的有效性。为了解决这些问题,我们提出了MetaSSC,一种基于元学习的新型SSC框架,利用可变形卷积、大内核注意力以及Mamba(D-LKA-M)模型。我们的方法首先通过基于体素的语义分割(SS)预训练任务,旨在探究不完整区域的语义和几何特征,同时获取可转移的元知识。使用模拟的协同感知数据集,我们利用来自多个相邻连接式自动驾驶车辆(CAVs)的聚合传感器数据监督单个车辆的感知训练,生成更丰富和更全面的标签。然后,通过不增加额外模型参数的双阶段训练策略将这些元知识适应目标域,实现高效的部署。为了进一步增强模型在3D体素网格内捕捉长序列关系的能力,我们将Mamba块与可变形卷积和大内核注意力整合到骨干网络中。广泛的实验表明,MetaSSC 达到了最先进的性能,显著优于竞争模型,并且降低了部署成本。