LLM2D
受“盲人摸象”哲学启发的对比学习增强
Enhancing Contrastive Learning Inspired by the Philosophy of "The Blind Men and the Elephant"
作者: Yudong Zhang, Ruobing Xie, Jiansheng Chen, Xingwu Sun, Zhanhui Kang, Yu Wang
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2412.16522v2

摘要

arXiv:2412.16522v2 Announce Type: replace-cross 摘要:对比学习是自我监督视觉表示学习中广泛使用的技术,通常通过在同一图像上应用两种数据增强方法来生成正样本对。设计有效的数据增强策略对于对比学习的成功至关重要。受盲人摸象故事的启发,我们引入了JointCrop和JointBlur方法。这些方法通过利用两种增强参数的联合分布来生成更具挑战性的正样本对,从而使得对比学习能够获取更有效的特征表示。据我们所知,这是第一次在对比学习中显式地将两种数据增强参数的联合分布纳入其中的努力。作为一种无需额外计算开销的即插即用框架,JointCrop和JointBlur显著提高了SimCLR、BYOL、MoCo v1、MoCo v2、MoCo v3、SimSiam和Dino基线模型的性能。