LLM2D
理解无分类器引导:高维理论与非线性泛化
Understanding Classifier-Free Guidance: High-Dimensional Theory and Non-Linear Generalizations
作者: Krunoslav Lehman Pavasovic, Jakob Verbeek, Giulio Biroli, Marc Mezard
发布日期: 2/13/2025
arXiv ID: oai:arXiv.org:2502.07849v1

摘要

arXiv:2502.07849v1 交叉公告类型: 摘要:近期的研究对分类器无引导(Classifier-Free Guidance, CFG)的有效性提出了担忧,表明在低维环境中,它可能导致目标分布的过度偏离,并减少样本多样性。在本工作中,我们展示了在无限和足够高维的背景下,CFG 有效地再现了目标分布,揭示了一个维度的祝福结果。此外,我们探讨了有限维度的影响,精确地表征了过度偏离和方差减少。基于我们的分析,我们引入了非线性的 CFG 扩展。通过高斯混合模型上的数值模拟以及类别条件和文本到图像扩散模型的实验,我们验证了我们的分析,并展示了我们的非线性 CFG 在不增加计算成本的情况下提供了更好的灵活性和生成质量。