LLM2D

摘要

arXiv:2502.04790v1 类别: cross 摘要: 大型语言模型（LLMs）在各种自然语言处理（NLP）场景中展现出了惊人的能力，但在处理复杂算术和逻辑推理任务时仍然面临挑战。虽然链式思考（CoT）推理、自我一致性（SC）和自我纠正策略试图在顺序、多步推理中引导模型，多代理辩论（MAD）已经作为一种增强LLMs推理能力的有效方法出现了。通过增加代理的数量和辩论的频率，LLMs的性能显著提升。然而，这种策略导致了token成本的显著增加，提出了扩展性的障碍。为了应对这一挑战，我们提出了一种新的稀疏化策略，旨在在MAD中减少token成本。该方法通过最小化无效的信息交换和无益的讨论，从而增强辩论过程的整体效率。我们在多个数据集上对多种模型进行了比较实验，表明我们的方法在MAD中显著减少了token成本。具体来说，与MAD相比，我们的方法在保持性能下降低于2.0%的情况下，实现了高达94.5%的token成本的显著减少。