摘要
arXiv:2502.03540v1 宣告类型: cross
摘要: 在本文中,我们研究了在掩码扩散模型(MDMs)推断过程中,token被解掩的方法顺序如何影响生成质量。我们推导出一个扩展的证据下界(ELBO),其中引入了一个规划器,负责在每一步选择解掩哪些token。我们的分析表明,不同的解掩策略可以提高生成性能。基于这些见解,我们提出了路径规划(P2),一种利用预训练的BERT或去噪器本身来引导解掩决策的采样框架。P2能够扩展所有已知的MDM采样策略,并在包括语言生成(上下文学习、代码生成、故事填充、数学推理、反向诅咒纠正)和生物序列生成(蛋白质和RNA序列)等多种领域实现显著改进。