摘要
现有的3D掩码学习方法在数据有限的情况下遇到了性能瓶颈,我们的目标是克服这一限制。本文提出了一种三点掩码方案(TPM),它作为掩码自动编码器预训练的可扩展框架,以实现3D点云的多掩码学习。具体来说,我们将两个额外的掩码选择(即中等掩码和低掩码)添加到基线中,因为我们的核心见解是,对象的恢复过程可以以多种方式表现出来。以往的高掩码方案侧重于捕捉全局表示,但缺乏细粒度的恢复能力,因此生成的预训练权重在微调过程中往往作用有限。在提出的TPM的支持下,现有方法可以展现出更灵活和准确的完成能力,使预训练阶段的潜在自动编码器能够考虑单个3D对象的多种表示。此外,还提出了一种SVM引导的权重选择模块,在微调阶段用最佳权重填充下游网络的编码器参数,最大限度地提高线性精度,并促进对新对象的复杂表示的获取。大量实验表明,配备了所提出的TPM的四个基线在各种下游任务上取得了全面的性能提升。