摘要
arXiv:2504.10612v2 宣告类型: replace-cross
摘要: 最常用的生成模型通过匹配流或分数将噪声和数据分布映射在一起。然而,它们在处理部分观测和额外先验信息方面存在困难,而能量基于模型(EBMs)通过简单地添加相应的标量能量项就能优雅地处理这些问题。我们通过提出能量匹配框架来解决这一问题,该框架为基于流动的方法赋予了EBMs的灵活性。远离数据流形时,样本沿着无旋、最优输运路径从噪声转移到数据。当它们接近数据流形时,一个熵能量项引导系统进入玻尔兹曼平衡分布,明确地捕捉到了数据的潜在似然结构。我们用一个单一的时间独立标量场参数化这种动态,该场兼具强大的生成器和灵活的先验作用,用于有效的逆问题正则化。我们的方法在CIFAR-10和ImageNet生成方面在保真度上显著优于现有的EBMs,同时保留了基于流动的方法在远离数据流形处无模拟的训练。此外,我们利用方法的灵活性引入了一种相互作用能量,以支持多样模式的探索,这在受控蛋白质生成设定中得到了验证。我们的方法专注于学习一个标量势能——无需时间条件、辅助生成器或额外网络——这标志着与最近的EBM方法的重大 departure。我们认为,这种简化框架显著增强了EBMs的能力,并为它们在生成建模领域中的广泛应用铺平了道路。