LLM2D

摘要

arXiv:2502.00511v2 类型: 替换交叉摘要：大型语言模型（LLMs）的最近进展展现了卓越的推理能力。然而，单次推理对于复杂的推理任务往往会导致不可靠的结果，这促使研究人员通过困惑度和自一致性等方法探索多种推理路径。在本文中，我们首次提供了对这些技术的理论误差分解分析，将它们的误差分解为估计误差和模型误差。我们的分析揭示了一个基本的权衡：困惑度方法由于缺乏适当的 consistency 函数而导致显著的模型误差，而自一致性由于收敛误差的缓慢速度而导致较高的估计误差。为了克服这些限制，我们提出了推理修剪困惑度一致性（RPC）这种方法。这种方法结合了困惑度一致性，无缝地将LLM的困惑度与自一致性集成在一起，并且通过消除低概率的推理路径有效地防止估计误差减少的退化。理论分析表明，RPC 不仅将估计误差的收敛率加速到指数级别，还具有进一步减少模型误差的强潜力。在七个基准数据集上的广泛实验评估证实，RPC 显著提高了推理性能、采样效率和置信可靠性。