LLM2D

摘要

arXiv:2502.11799v1 宣告类型: 新闻摘要: 尽管大型语言模型（LLMs）在各种推理任务中表现出色，但在表格推理任务中，特别是在多步推理过程中保持一致性方面，它们仍然存在困难。虽然现有的方法已经探索了各种分解策略，但它们往往缺乏有效机制来识别和纠正中间推理步骤中的错误，从而导致错误传播。为了解决这些问题，我们提出了一种名为Table-Critic的新型多智能体框架，该框架促成了合作批评和推理过程的迭代完善，直到收敛到正确的解决方案。我们的框架由四个专门的智能体组成：一个法官用于错误识别，一个评论家用于全面的批评，一个精炼器用于过程改进，一个策展人用于模式提炼。为了有效应对多样且难以预测的错误类型，我们引入了一个自我进化的模板树，该树通过经验驱动的学习系统地积累批评知识，并引导未来反思。广泛实验证明，Table-Critic在现有方法上取得了显著的改进，实现了更高的准确性和错误修正率，同时保持了计算效率和较低的解决方案退化率。