LLM2D

摘要

arXiv:2503.13985v2 通告类型: 替换-交叉摘要: 由于缺陷数据稀缺，开发有效的视觉检测模型仍然具有挑战性。尽管已经使用图像生成模型来合成缺陷图像，但生成高度真实的缺陷仍然困难重重。我们提出了一种名为 DefectFill 的新颖方法，仅需少量参考缺陷图像即可进行真实的缺陷生成。该方法利用了一种微调的 inpainting 扩散模型，该模型通过整合缺陷、对象和注意力项的自定义损失函数进行了优化。这种方法能够精确捕捉详细的、局部的缺陷特征，并将这些特征无缝地整合到无缺陷的对象中。此外，我们还提出了低保真度选择方法，进一步提高了缺陷样本的质量。实验结果表明，DefectFill 生成了高质量的缺陷图像，使视觉检测模型在 MVTec AD 数据集上达到了最先进的性能。