摘要
arXiv:2502.03678v1 降噪类型: cross
摘要:在大型语言模型(LLMs)中,自回归解码在文本生成中的广泛应用由于缺乏内置机制来进行生成内容的改进和/或修正,本质上是次优的。我们在本文中以联合概率的形式考虑生成回复的最优性,即将所有相同时间的标记一起考虑。我们理论上 characterizes 自回归生成的回复与其长度相同的全局最优对应物之间的潜在偏差。我们的分析表明,在文本生成过程中,当明显出现不确定性时,我们需要注意,这可能表明生成历史的次优性。为了应对自回归解码在文本生成中的缺陷,我们提出了一种方法,该方法结合了滑动反射窗口和暂停准则,使得在解码过程中可以互换地进行改进和生成。我们的选择性改进框架在效率和最优性之间取得了平衡,我们广泛实验结果证明了该方法的有效性。