摘要
arXiv:2502.04790v1 类别: cross
摘要: 大型语言模型(LLMs)在各种自然语言处理(NLP)场景中展现出了惊人的能力,但在处理复杂算术和逻辑推理任务时仍然面临挑战。虽然链式思考(CoT)推理、自我一致性(SC)和自我纠正策略试图在顺序、多步推理中引导模型,多代理辩论(MAD)已经作为一种增强LLMs推理能力的有效方法出现了。通过增加代理的数量和辩论的频率,LLMs的性能显著提升。然而,这种策略导致了token成本的显著增加,提出了扩展性的障碍。为了应对这一挑战,我们提出了一种新的稀疏化策略,旨在在MAD中减少token成本。该方法通过最小化无效的信息交换和无益的讨论,从而增强辩论过程的整体效率。我们在多个数据集上对多种模型进行了比较实验,表明我们的方法在MAD中显著减少了token成本。具体来说,与MAD相比,我们的方法在保持性能下降低于2.0%的情况下,实现了高达94.5%的token成本的显著减少。