摘要
arXiv:2308.11914v4 宣告类型:替换
摘要:尽管基础模型取得了进步,但由于其记忆和推理能力有限,基于知识的推理仍然是一个持久的挑战。当前的方法主要侧重于鼓励这些模型进行规划和解决问题,或者独立地大量生成推理链。然而,这些方法往往忽略了概念性错误和推理谬误,不可避免地导致一系列严重的缺陷,如误导性的结论、认知偏见和决策质量下降。虽然明确建模因果关系被认为有可能解决这些问题,但当前的研究努力尚未实现基于因果关系的基础模型。受到多种专门代理协同工作以应对复杂任务启发的启发,我们提出了一个名为因果一致思考链(CaCo-CoT)的框架,利用多代理合作来增强基础模型的忠实性和因果性,包括一组推理者和评估者。这些代理在推理和共识的模式下协作,以提高忠实性。推理者的任务是通过模仿人类的因果推理为知识密集型问题生成推理链。同时,评估者从非因果和反事实的角度审查推理者的推理链的一致性。我们的框架通过广泛的全面评估(例如,科学问题回答和常识推理的文本和多模态知识推理任务)在各个任务中证明了显著的优势。