LLM2D
自适应可控扩散模型用于高效的条件图像生成
Adaptively Controllable Diffusion Model for Efficient Conditional Image Generation
作者: Yucheng Xing, Xiaodong Liu, Xin Wang
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15199v1

摘要

随着人工智能的发展,越来越多的注意力集中在生成模型上,生成模型代表了创造力,这是智能的一个非常重要的方面。近年来,扩散模型已被研究并证明比以前的方法更合理有效。然而,常见的扩散框架存在可控性问题。虽然一些工作已经考虑了额外的条件来指导扩散过程以生成特定目标,但这只控制了生成结果,而不是其过程。在这项工作中,我们提出了一种新的自适应框架,即自适应可控扩散 (AC-Diff) 模型,来自动且完全控制生成过程,不仅包括生成结果的类型,还包括生成过程的长度和参数。输入和条件将首先被送入条件时间步长 (CTS) 模块以确定生成所需的步数。然后,根据过程的长度,将通过我们的自适应混合噪声调度 (AHNS) 模块估计扩散率参数。我们进一步使用相应的自适应采样机制训练网络,以学习如何根据条件调整自身以提高整体性能。为了实现其实际应用,AC-Diff 有望在保持与文献中扩散模型相同的性能的同时,大幅减少平均生成步骤和执行时间。