LLM2D
UniDB:统一扩散桥梁框架通过随机最优控制
UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control
作者: Kaizhen Zhu, Mokai Pan, Yuexin Ma, Yanwei Fu, Jingyi Yu, Jingya Wang, Ye Shi
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05749v1

摘要

arXiv:2502.05749v1 类型: cross 摘要: 近年来,在扩散桥模型方面的进展利用了Doob的h-变换来在分布之间建立固定端点,这一方法在图像翻译和修复任务中展现了有前途的结果。然而,这些方法经常生成模糊或过度平滑的图像细节,并且缺乏一个全面的理论基础来解释这些不足。为了解决这些局限性,我们提出了基于随机最优控制(SOC)的统一扩散桥框架UniDB。UniDB通过基于SOC的优化问题进行了建模,并推导出了最优控制器的闭合形式解,从而统一和泛化了现有的扩散桥模型。我们证明了现有使用Doob的h-变换的扩散桥模型构成我们框架的特殊情况,当SOC代价函数中的终端惩罚系数趋向无穷大时出现。通过引入可调的终端惩罚系数,UniDB在控制成本和终端惩罚之间实现了最佳平衡,显著提高了细节保留和输出质量。值得注意的是,UniDB无缝地与现有的扩散桥模型集成,只需要少量的代码修改。广泛的实验在不同类型的图像修复任务中验证了所提出框架的优越性和适应性。我们的代码可在https://github.com/UniDB-SOC/UniDB/获得。