LLM2D

摘要

arXiv:2502.04556v1 类型: cross 摘要: 大型语言模型（LLMs）在一致生成真实的回答方面known to struggle with（众所周知存在问题）。虽然已经提出了各种表示干预技术，但这些方法通常会对所有输入查询应用一个通用的表示修正向量，这在实际中限制了它们对多样查询的效果。在这项研究中，我们引入了TruthFlow，这是一种新颖的方法，利用Flow Matching技术进行查询特定的真理表示修正。具体而言，TruthFlow首先使用流模型学习查询特定的修正向量，以使表示从幻觉状态过渡到真实的状态。然后，在推理过程中，训练好的流模型生成这些修正向量以增强LLM输出的真实性。实验结果表明，TruthFlow在对各种先进的LLM在TruthfulQA上进行评估的各种开放生成任务中显著提高了性能。此外，训练好的TruthFlow模型表现出很强的迁移性，在其他未见过的幻觉基准测试中表现有效。