LLM2D
增强AI面部真实性:通过完全合成数据集在精炼扩散模型中的成本效益质量提升
Enhancing AI Face Realism: Cost-Efficient Quality Improvement in Distilled Diffusion Models with a Fully Synthetic Dataset
作者: Jakub W\k{a}sala, Bart{\l}omiej Wrzalski, Kornelia Noculak, Yuliia Tarasenko, Oliwer Krupa, Jan Koco\'n, Grzegorz Chodak
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.02255v1

摘要

arXiv:2505.02255v1 Announce Type: cross 摘要:本研究提出了一种通过扩散模型提高图像生成的成本-质量比的新方法。我们假设精简版(例如,FLUX.1-schnell)和基线版(例如,FLUX.1-dev)模型之间的差异是一致的,并且可以在类似于人物生成的专业领域内进行学习。我们生成了一个合成配对数据集,并训练了一个快速的图像到图像的转换头部。使用低质量和高質量的合成图像两组,我们的模型被训练成将一个精简版生成器(例如,FLUX.1-schnell)的输出优化到与基线生成器(如FLUX.1-dev)相当的水平,尽管FLUX.1-dev在计算强度方面更高。我们的结果显示,将一个大型生成模型的精简版本与我们的增强层结合的管线,与FLUX.1-dev相比,可以降低高达82%的计算成本,同时生成类似的逼真人物图像。本研究展示了在大规模图像生成中提高AI解决方案效率的潜力。