LLM2D

摘要

基于Transformer的模型近期通过利用自注意力机制促进了点云理解的发展，然而，这些方法常常忽略不太显著区域中的潜在信息，导致对扰动的敏感性增加以及全局理解能力有限。为了解决这个问题，我们引入了PointACL，一个旨在解决这些局限性的注意力驱动对比学习框架。我们的方法采用了一种注意力驱动的动态掩码策略，引导模型关注未充分关注的区域，增强对点云中全局结构的理解。然后，我们将原始预训练损失与对比学习损失相结合，从而提高特征判别能力和泛化能力。大量的实验验证了PointACL的有效性，因为它在各种3D理解任务中取得了最先进的性能，包括目标分类、部件分割和少样本学习。具体来说，当与Point-MAE和PointGPT等不同的Transformer主干网络集成时，PointACL在ScanObjectNN、ModelNet40和ShapeNetPart等数据集上展现出改进的性能。这突显了其在捕捉全局和局部特征方面的优越能力，以及其增强的抗扰动性和对不完整数据的鲁棒性。