LLM2D
表评论家:一种在表格推理中的协作批评与修正多 agent 框架
Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning
作者: Peiying Yu, Guoxin Chen, Jingjing Wang
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11799v1

摘要

arXiv:2502.11799v1 宣告类型: 新闻 摘要: 尽管大型语言模型(LLMs)在各种推理任务中表现出色,但在表格推理任务中,特别是在多步推理过程中保持一致性方面,它们仍然存在困难。虽然现有的方法已经探索了各种分解策略,但它们往往缺乏有效机制来识别和纠正中间推理步骤中的错误,从而导致错误传播。为了解决这些问题,我们提出了一种名为Table-Critic的新型多智能体框架,该框架促成了合作批评和推理过程的迭代完善,直到收敛到正确的解决方案。我们的框架由四个专门的智能体组成:一个法官用于错误识别,一个评论家用于全面的批评,一个精炼器用于过程改进,一个策展人用于模式提炼。为了有效应对多样且难以预测的错误类型,我们引入了一个自我进化的模板树,该树通过经验驱动的学习系统地积累批评知识,并引导未来反思。广泛实验证明,Table-Critic在现有方法上取得了显著的改进,实现了更高的准确性和错误修正率,同时保持了计算效率和较低的解决方案退化率。