摘要
arXiv:2505.02255v1 Announce Type: cross
摘要:本研究提出了一种通过扩散模型提高图像生成的成本-质量比的新方法。我们假设精简版(例如,FLUX.1-schnell)和基线版(例如,FLUX.1-dev)模型之间的差异是一致的,并且可以在类似于人物生成的专业领域内进行学习。我们生成了一个合成配对数据集,并训练了一个快速的图像到图像的转换头部。使用低质量和高質量的合成图像两组,我们的模型被训练成将一个精简版生成器(例如,FLUX.1-schnell)的输出优化到与基线生成器(如FLUX.1-dev)相当的水平,尽管FLUX.1-dev在计算强度方面更高。我们的结果显示,将一个大型生成模型的精简版本与我们的增强层结合的管线,与FLUX.1-dev相比,可以降低高达82%的计算成本,同时生成类似的逼真人物图像。本研究展示了在大规模图像生成中提高AI解决方案效率的潜力。