摘要
arXiv:2503.13985v2 通告类型: 替换-交叉
摘要: 由于缺陷数据稀缺,开发有效的视觉检测模型仍然具有挑战性。尽管已经使用图像生成模型来合成缺陷图像,但生成高度真实的缺陷仍然困难重重。我们提出了一种名为 DefectFill 的新颖方法,仅需少量参考缺陷图像即可进行真实的缺陷生成。该方法利用了一种微调的 inpainting 扩散模型,该模型通过整合缺陷、对象和注意力项的自定义损失函数进行了优化。这种方法能够精确捕捉详细的、局部的缺陷特征,并将这些特征无缝地整合到无缺陷的对象中。此外,我们还提出了低保真度选择方法,进一步提高了缺陷样本的质量。实验结果表明,DefectFill 生成了高质量的缺陷图像,使视觉检测模型在 MVTec AD 数据集上达到了最先进的性能。