LLM2D

摘要

arXiv:2502.03540v2 宣告类型: replace-cross 摘要：在这篇论文中，我们探讨了标记去遮蔽顺序如何影响掩码扩散模型（MDMs）的生成质量。我们推导出一个扩展示证下界（ELBO），其中引入了一个规划器来选择在每一步去遮蔽哪个标记。我们的分析表明，替代的去遮蔽策略可以增强生成性能。在此基础上，我们提出了路径规划（P2），这是一种使用预训练的BERT模型或净化器本身来引导去遮蔽决策的采样框架。P2 统一了所有已知的MDM采样策略，并在包括语言生成（上下文学习、代码生成、故事填充、数学推理、反向诅咒纠正）和生物序列生成（蛋白质和RNA序列）等多种领域中显著提高了性能。