LLM2D

摘要

现有的3D掩码学习方法在数据有限的情况下遇到了性能瓶颈，我们的目标是克服这一限制。本文提出了一种三点掩码方案（TPM），它作为掩码自动编码器预训练的可扩展框架，以实现3D点云的多掩码学习。具体来说，我们将两个额外的掩码选择（即中等掩码和低掩码）添加到基线中，因为我们的核心见解是，对象的恢复过程可以以多种方式表现出来。以往的高掩码方案侧重于捕捉全局表示，但缺乏细粒度的恢复能力，因此生成的预训练权重在微调过程中往往作用有限。在提出的TPM的支持下，现有方法可以展现出更灵活和准确的完成能力，使预训练阶段的潜在自动编码器能够考虑单个3D对象的多种表示。此外，还提出了一种SVM引导的权重选择模块，在微调阶段用最佳权重填充下游网络的编码器参数，最大限度地提高线性精度，并促进对新对象的复杂表示的获取。大量实验表明，配备了所提出的TPM的四个基线在各种下游任务上取得了全面的性能提升。