摘要
arXiv:2502.09609v2 宣告类型: replace-cross
摘要: 我们提出了混合分数训练 (SMT),这是一种通过最小化一类称为 $\alpha$-偏斜杰森-香农散度的发散来训练一步生成模型的新框架。其核心在于,SMT 通过多个噪声水平估计真实样本和假样本混合分布的分数。与一致性模型类似,我们的方法支持从零开始训练 (SMT) 以及使用预训练扩散模型的蒸馏,我们称之为混合分数蒸馏 (SMD)。实现简单,需要的超参数调优极少,并确保训练稳定。在 CIFAR-10 和 ImageNet 64x64 上的实验表明,SMT/SMD 与现有方法相当,甚至可以超越现有方法。