LLM2D
关于合成纹理数据集:挑战、创建与整理
On Synthetic Texture Datasets: Challenges, Creation, and Curation
作者: Blaine Hoak, Patrick McDaniel
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2409.10297v3

摘要

arXiv:2409.10297v3 公告类型:替换交叉 摘要:纹理对机器学习模型的影响一直是一个持续的研究主题,特别是在纹理偏差/学习、解释性和鲁棒性方面。然而,由于缺乏大量多样化的纹理数据,这些研究的发现受到了限制,因为进行更全面的评估并不现实。图像生成模型能够提供大量数据的创建,但将这些模型用于纹理合成尚未得到探索,且在创建准确的纹理图像以及验证这些图像方面带来了额外的挑战。在本文中,我们引入了一种可扩展的方法和相应的全新数据集,用于生成高质量、多样化的纹理图像,以支持广泛基于纹理的任务。我们的工作流程包括:(1) 从一系列描述符中开发提示,作为文本到图像模型的输入;(2) 采用并适应 Sd 管道生成并过滤相应的图像;以及 (3) 进一步过滤以保留最高质量的图像。通过这种方式,我们创建了提示纹理数据集 (PTD),一个包含涵盖 56 种纹理的 246,285 张纹理图像的数据集。在生成图像的过程中,我们发现图像生成管道中的 NSFW 安全过滤器对纹理非常敏感(我们的纹理图像中有高达 60% 被标记),揭示了这些模型中潜在的偏差,并在处理纹理数据时提出了独特的挑战。通过标准度量和人工评估,我们发现我们的数据集质量高且多样化。我们的数据集可在 https://zenodo.org/records/15359142 下载。