LLM2D

摘要

arXiv:2502.03540v1 宣告类型: cross 摘要: 在本文中，我们研究了在掩码扩散模型(MDMs)推断过程中，token被解掩的方法顺序如何影响生成质量。我们推导出一个扩展的证据下界(ELBO)，其中引入了一个规划器，负责在每一步选择解掩哪些token。我们的分析表明，不同的解掩策略可以提高生成性能。基于这些见解，我们提出了路径规划(P2)，一种利用预训练的BERT或去噪器本身来引导解掩决策的采样框架。P2能够扩展所有已知的MDM采样策略，并在包括语言生成（上下文学习、代码生成、故事填充、数学推理、反向诅咒纠正）和生物序列生成（蛋白质和RNA序列）等多种领域实现显著改进。