LLM2D
基于注意力机制的对比学习的点云理解
Point Cloud Understanding via Attention-Driven Contrastive Learning
作者: Yi Wang, Jiaze Wang, Ziyu Guo, Renrui Zhang, Donghao Zhou, Guangyong Chen, Anfeng Liu, Pheng-Ann Heng
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14744v1

摘要

基于Transformer的模型近期通过利用自注意力机制促进了点云理解的发展,然而,这些方法常常忽略不太显著区域中的潜在信息,导致对扰动的敏感性增加以及全局理解能力有限。为了解决这个问题,我们引入了PointACL,一个旨在解决这些局限性的注意力驱动对比学习框架。我们的方法采用了一种注意力驱动的动态掩码策略,引导模型关注未充分关注的区域,增强对点云中全局结构的理解。然后,我们将原始预训练损失与对比学习损失相结合,从而提高特征判别能力和泛化能力。大量的实验验证了PointACL的有效性,因为它在各种3D理解任务中取得了最先进的性能,包括目标分类、部件分割和少样本学习。具体来说,当与Point-MAE和PointGPT等不同的Transformer主干网络集成时,PointACL在ScanObjectNN、ModelNet40和ShapeNetPart等数据集上展现出改进的性能。这突显了其在捕捉全局和局部特征方面的优越能力,以及其增强的抗扰动性和对不完整数据的鲁棒性。