LLM2D
TruthFlow:通过表示流矫正实现诚实的LLM生成
TruthFlow: Truthful LLM Generation via Representation Flow Correction
作者: Hanyu Wang, Bochuan Cao, Yuanpu Cao, Jinghui Chen
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2502.04556v1

摘要

arXiv:2502.04556v1 类型: cross 摘要: 大型语言模型(LLMs)在一致生成真实的回答方面known to struggle with(众所周知存在问题)。虽然已经提出了各种表示干预技术,但这些方法通常会对所有输入查询应用一个通用的表示修正向量,这在实际中限制了它们对多样查询的效果。在这项研究中,我们引入了TruthFlow,这是一种新颖的方法,利用Flow Matching技术进行查询特定的真理表示修正。具体而言,TruthFlow首先使用流模型学习查询特定的修正向量,以使表示从幻觉状态过渡到真实的状态。然后,在推理过程中,训练好的流模型生成这些修正向量以增强LLM输出的真实性。实验结果表明,TruthFlow在对各种先进的LLM在TruthfulQA上进行评估的各种开放生成任务中显著提高了性能。此外,训练好的TruthFlow模型表现出很强的迁移性,在其他未见过的幻觉基准测试中表现有效。