LLM2D

摘要

arXiv:2412.16522v2 Announce Type: replace-cross 摘要：对比学习是自我监督视觉表示学习中广泛使用的技术，通常通过在同一图像上应用两种数据增强方法来生成正样本对。设计有效的数据增强策略对于对比学习的成功至关重要。受盲人摸象故事的启发，我们引入了JointCrop和JointBlur方法。这些方法通过利用两种增强参数的联合分布来生成更具挑战性的正样本对，从而使得对比学习能够获取更有效的特征表示。据我们所知，这是第一次在对比学习中显式地将两种数据增强参数的联合分布纳入其中的努力。作为一种无需额外计算开销的即插即用框架，JointCrop和JointBlur显著提高了SimCLR、BYOL、MoCo v1、MoCo v2、MoCo v3、SimSiam和Dino基线模型的性能。