LLM2D

摘要

arXiv:2412.16897v2 Announce Type: replace-cross 摘要：少样本缺陷多分类（FSDMC）是工业制造中的质量控制中的一个新兴趋势。然而，当前的FSDMC研究往往由于集中在特定的数据集上而缺乏普适性。此外，缺陷分类高度依赖于图像中的上下文信息，而现有的方法在有效提取这些信息方面存在不足。为了应对这些挑战，我们提出了一种通用的FSDMC框架MVREC，该框架具有两个主要优势：（1）MVREC通过结合预训练的AlphaCLIP模型提取缺陷实例的一般特征。（2）它利用区域上下文框架通过利用掩码区域输入和多视图上下文增强来增强缺陷特征。此外，模型中引入了Few-shot Zip-Adapter(-F)分类器，用于缓存支持集的视觉特征并执行少样本分类。我们还基于MVTec AD引入了MVTec-FS这一新的FSDMC基准，其中包括1228个带有实例级掩码注释的缺陷图像和46种缺陷类型。在MVTec-FS和四个额外数据集上进行的广泛实验表明，其在通用缺陷分类方面的效果，并且能够结合上下文信息以提高分类性能。代码：https://github.com/ShuaiLYU/MVREC