LLM2D

摘要

arXiv:2410.08475v2 通告类型: 修改摘要: 依赖上下文提示或强化学习(RL)以改进大型语言模型(LLMs)的推理能力的方法，都依赖于LLMs内部的知识来生成可靠的链式思考(CoT)。然而，无论LLMs的大小如何，某些问题仍然无法在一 passes 中得到解决。同时，基于代理的推理系统需要访问全面的非参数化知识库，这对于科学和专门领域的使用往往是昂贵的或不可行的。我们提出了图启发的真实性外推(GIVE)，这是一种新颖的推理方法，将参数性和非参数性记忆相结合，以在最少的外部输入下提高准确推理的能力。GIVE 指引LLM 代理选择最相关专有数据(观察)，参与查询特定的发散性思考(反思)，然后综合这些信息以生成最终输出(发言)。广泛的实验表明，我们的框架具有以下优点：(1) GIVE 在各种尺寸的LLMs中提高了性能。(2) 在某些场景中，GIVE 使较小的LLMs能够在科学任务中超越更大的、更复杂的LLMs (GPT3.5T + GIVE > GPT4)。(3) GIVE 在科学和开域评估中有效。(4) GIVE 是一种无需训练的方法，使LLMs能够应对超出其训练数据的新问题 (准确率提升从43.5% -> 88.2%)。(5) GIVE 允许LLM代理使用有限的(非常小)和噪音的(非常大)知识源进行推理，能够支持从135到超过840,000个节点的知识图。(6) GIVE 的推理过程完全可解释。