LLM2D
增强AI面部真实性:通过使用全合成数据集在提炼扩散模型中的成本效率质量提升
Enhancing AI Face Realism: Cost-Efficient Quality Improvement in Distilled Diffusion Models with a Fully Synthetic Dataset
作者: Jakub Wasala, Bartlomiej Wrzalski, Kornelia Noculak, Yuliia Tarasenko, Oliwer Krupa, Jan Kocon, Grzegorz Chodak
发布日期: 5/12/2025
arXiv ID: oai:arXiv.org:2505.02255v2

摘要

arXiv:2505.02255v2 通告类型: 交叉替换 摘要:本研究提出了一种增强图像生成于扩散模型中的成本与质量比的新方法。我们假设蒸馏模型(例如,FLUX.1-schnell)与基础模型(例如,FLUX.1-dev)之间的差异是一致的,因此可以在特定领域(如肖像生成)进行学习。我们生成了一个合成配对数据集,并训练了一个快速的图像到图像翻译头部。使用低质量与高质量的合成图像两组数据,我们的模型被训练以将蒸馏生成器(例如,FLUX.1-schnell)的输出优化到与基础模型(例如,FLUX.1-dev)相媲美的水平。FLUX.1-dev模型更为计算密集。我们的结果显示,结合了大生成模型蒸馏版本和我们增强层的流水线,与基础版本相比,计算成本最多可以降低82%,生成具有相似照片真实度的肖像。本研究展示了在大规模图像生成涉及的AI解决方案中提高效率的潜在可能性。