LLM2D

摘要

arXiv:2408.11054v3 公告类型: replace-cross 摘要: 我们引入了NeCo: 崭块邻近一致性，这是一种新颖的自监督训练损失，它在学生模型和教师模型之间强制执行块级别的最邻近一致性。与仅提供二进制学习信号（即，“吸引”和“排斥”）的对比方法相比，这种方法得益于排序空间密集特征相对于参考块的更精细的学习信号。我们的方法利用了在预训练表示基础上的可微排序，例如DINOv2-registered，以启动学习信号并进一步改进它们。这种预训练后的密集排序在各种模型和数据集上取得了优越的性能，尽管只需要单个GPU上的19小时。该方法生成高质量的密集特征编码器，并建立了几个新的最先进成果，例如，在ADE20k和Pascal VOC上的非参数上下文语义分割分别提高了5.5%和6%，在COCO-Things和-COCO-Stuff上的线性分割评估分别提高了7.2%和5.7%，以及在SPair-71k上的多视图一致性三维理解提高了1.5%以上。