摘要
arXiv:2502.05749v2 宣传类型: 替换交叉
摘要:最近在扩散桥模型方面的进展利用了Doob的 $h$-变换来在分布之间建立固定的端点,展示了在图像转换和修复任务中的有希望的结果。然而,这些方法经常生成模糊或过度平滑的图像细节,并缺乏全面的理论基础来解释这些缺点。为了解决这些限制,我们提出了一种基于随机最优控制(SOC)的统一框架UniDB。UniDB通过SOC为基础的优化来制定问题,并推导出最优控制器的闭式解,从而统一并泛化现有的扩散桥模型。我们证明,使用Doob的 $h$-变换的现有扩散桥模型是我们框架的特殊情况,当SOC成本函数中的终端惩罚系数趋向无穷大时,这种模型会浮现出来。通过引入可调整的终端惩罚系数,UniDB 实现了控制成本和终端惩罚之间的最优平衡,显著改善了细节保真度和输出质量。值得注意的是,UniDB 平滑地与现有的扩散桥模型集成,只需要少量的代码修改。广泛的实验跨越了多种图像修复任务,验证了所提出框架的优越性和适应性。我们的代码可在 https://github.com/UniDB-SOC/UniDB/ 获取。