LLM2D
能量匹配:统一流匹配和能量基于模型的生成建模
Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling
作者: Michal Balcerak, Tamaz Amiranashvili, Suprosanna Shit, Antonio Terpin, Sebastian Kaltenbach, Petros Koumoutsakos, Bjoern Menze
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2504.10612v1

摘要

arXiv:2504.10612v1 宣布类型: cross 摘要: 生成模型通常通过匹配流或得分将噪声映射到数据,但这些方法在引入部分观测或额外先验时变得繁琐。受到最近在 Wasserstein 梯度流方面取得进展的启发,我们提出了一种能量匹配框架,该框架将基于流的方法与能量驱动模型(EBMs)的灵活性统一起来。远离数据流形,样本沿着无旋、最优传输路径从噪声到数据移动。当它们接近数据流形时,熵能量项将系统引导至玻尔兹曼平衡分布,明确地捕捉数据的潜在似然结构。我们通过单一的时间不变标量场参数化这一动态,该场既是一个强大的生成器,也是一个灵活的先验,用于有效的逆问题正则化。我们的方法在 CIFAR-10 生成方面显著优于现有的 EBMs(FID 3.97 相对于 8.61),同时保留了基于传输的方法远离数据流形时的无模拟训练。此外,我们利用我们方法的灵活性并引入了一种相互作用能量进行多模态探索。我们的方法专注于学习一个静态的标量势能——无需时间条件、辅助生成器或额外网络——标志着与最近的 EBMs 方法的重要区别。我们认为,简化了这种框架显著促进了 EBMs 的能力,并为他们在各种生成建模领域的更广泛采用铺平了道路。