LLM2D
掩码扩散模型采样的路径规划
Path Planning for Masked Diffusion Model Sampling
作者: Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel, Jarrid Rector-Brooks, Sherwood Yao, Alexander Tong, Pranam Chatterjee
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.03540v3

摘要

arXiv:2502.03540v3 宣布类型: replace-cross 摘要:在本文中,我们探讨了掩码标记解遮蔽顺序对生成质量在掩码扩散模型(MDMs)中的影响。我们推导出一个扩展的证据下界(ELBO),引入了一个规划器来选择在每一步中解遮蔽哪些标记。我们的分析揭示了替代解遮蔽策略可以提升生成性能。在此基础上,我们提出了一种路径规划(P2)采样框架,该框架使用预训练的BERT模型或消噪器本身来引导解遮蔽决策。P2涵盖了所有已知的MDM采样策略,并在包括语言生成(上下文学习、代码生成、故事填充、数学推理、反向诅咒修正)和生物序列生成(蛋白质和RNA序列)在内的多种领域中显著提升了性能。