摘要
arXiv:2502.04790v2 Announce Type: replace-cross
摘要:大规模语言模型(LLMs)在各种自然语言处理(NLP)场景中展现出了卓越的能力,但在处理复杂的算术和逻辑推理任务时仍然面临挑战。虽然链式思考(CoT)推理、自一致性(SC)和自我纠正策略试图在顺序和多步推理中引导模型,但多代理辩论(MAD)已成为增强LLM推理能力的一种可行方法。通过增加代理的数量和辩论的频率,LLM的性能显著提高。然而,这种策略会导致显著增加的令牌费用,成为一个可扩展性的障碍。为应对这一挑战,我们提出了一种新颖的稀疏化策略,旨在在MAD中减少令牌费用。这种方法最大限度地减少了信息的无效交换和代理间无生产力的讨论,从而增强了辩论过程的整体效率。我们在多个数据集上的多种模型中进行了比较实验,证明我们的方法在很大程度上减少了MAD中的令牌费用。具体而言,与MAD相比,我们的方法在保持性能下降低于2.0%的前提下,实现了高达94.5%的显著令牌费用减少。