LLM2D

摘要

arXiv:2502.03540v3 宣布类型: replace-cross 摘要：在本文中，我们探讨了掩码标记解遮蔽顺序对生成质量在掩码扩散模型（MDMs）中的影响。我们推导出一个扩展的证据下界（ELBO），引入了一个规划器来选择在每一步中解遮蔽哪些标记。我们的分析揭示了替代解遮蔽策略可以提升生成性能。在此基础上，我们提出了一种路径规划（P2）采样框架，该框架使用预训练的BERT模型或消噪器本身来引导解遮蔽决策。P2涵盖了所有已知的MDM采样策略，并在包括语言生成（上下文学习、代码生成、故事填充、数学推理、反向诅咒修正）和生物序列生成（蛋白质和RNA序列）在内的多种领域中显著提升了性能。