摘要
arXiv:2502.14765v1 宣告类型:交叉
摘要:事实验证(FV)的目标是基于相关证据评估一项声明的真伪。传统的自动化FV方法包括一个三阶段的流水线,依赖于短证据片段和仅编码器的推理模型。最近的方法利用了LLM的多轮特性,将FV视为一个逐步解决问题的过程,其中生成并回答需要额外背景信息的问题,直到有足够的信息做出决策。这一迭代方法使得验证过程更具合理性并可解释。尽管这些方法已经在百科知识声明上得到了测试,但对于特定领域和现实世界的声明的研究仍然缺失。在本文中,我们将在三个医学事实核查数据集上应用迭代FV系统,并使用多种设置进行评估,包括不同的LLM、外部网络搜索以及使用逻辑谓词进行结构化推理。我们展示了与传统方法相比,最终性能的改进,并展示了逐步FV系统在特定领域声明上的高潜力。