LLM2D

摘要

arXiv:2505.02255v1 Announce Type: cross 摘要：本研究提出了一种通过扩散模型提高图像生成的成本-质量比的新方法。我们假设精简版（例如，FLUX.1-schnell）和基线版（例如，FLUX.1-dev）模型之间的差异是一致的，并且可以在类似于人物生成的专业领域内进行学习。我们生成了一个合成配对数据集，并训练了一个快速的图像到图像的转换头部。使用低质量和高質量的合成图像两组，我们的模型被训练成将一个精简版生成器（例如，FLUX.1-schnell）的输出优化到与基线生成器（如FLUX.1-dev）相当的水平，尽管FLUX.1-dev在计算强度方面更高。我们的结果显示，将一个大型生成模型的精简版本与我们的增强层结合的管线，与FLUX.1-dev相比，可以降低高达82%的计算成本，同时生成类似的逼真人物图像。本研究展示了在大规模图像生成中提高AI解决方案效率的潜力。