摘要
基于自一致性的方法通过反复采样多个输出并选择最一致的输出作为最终响应,在提高大型语言模型的真实性方面被证明非常有效。然而,现有的方法通常对任务格式有严格的限制,很大程度上限制了它们的适用性。在本文中,我们提出了整合解码 (ID),以释放自一致性在开放式生成任务中的潜力。ID 通过构建一组输入来运作,每个输入都以先前采样的响应为前缀,然后同时处理它们,下一个标记在每个解码步骤中通过聚合所有对应预测来选择。本质上,这种简单的方法隐式地将自一致性纳入解码目标。广泛的评估表明,ID 在各种语言模型上始终如一地提高了真实性,在 TruthfulQA (+11.2%)、Biographies (+15.4%) 和 LongFact (+8.5%) 基准测试中取得了显著的改进。随着采样响应数量的增加,性能提升逐渐放大,表明 ID 随着重复采样的扩展潜力。