摘要
大型语言模型 (LLM) 在问答 (QA) 任务中取得了最先进的性能,但是这些模型往往会在其回答中出现幻觉信息。一种方法侧重于通过将给定输入的属性整合到输出中来增强生成过程。然而,识别合适的属性并根据来源验证其准确性是一项复杂的任务,需要在评估此类系统方面进行重大改进。我们引入了一种面向属性的链式思维推理方法来提高属性的准确性。这种方法将推理过程集中在生成以属性为中心的输出上。使用 GPT-4 对两个上下文增强型问答数据集进行的评估表明,属性的准确性和正确性得到了提高。此外,将我们的方法与微调相结合,可以提高两个较小的 LLM 的响应和属性准确性,表明它们在某些情况下有可能超越 GPT-4。