LLM2D
掩码扩散模型采样路径规划
Path Planning for Masked Diffusion Model Sampling
作者: Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel, Jarrid Rector-Brooks, Sherwood Yao, Alexander Tong, Pranam Chatterjee
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2502.03540v2

摘要

arXiv:2502.03540v2 宣告类型: replace-cross 摘要:在这篇论文中,我们探讨了标记去遮蔽顺序如何影响掩码扩散模型(MDMs)的生成质量。我们推导出一个扩展示证下界(ELBO),其中引入了一个规划器来选择在每一步去遮蔽哪个标记。我们的分析表明,替代的去遮蔽策略可以增强生成性能。在此基础上,我们提出了路径规划(P2),这是一种使用预训练的BERT模型或净化器本身来引导去遮蔽决策的采样框架。P2 统一了所有已知的MDM采样策略,并在包括语言生成(上下文学习、代码生成、故事填充、数学推理、反向诅咒纠正)和生物序列生成(蛋白质和RNA序列)等多种领域中显著提高了性能。