LLM2D

摘要

arXiv:2502.14765v1 宣告类型：交叉摘要：事实验证（FV）的目标是基于相关证据评估一项声明的真伪。传统的自动化FV方法包括一个三阶段的流水线，依赖于短证据片段和仅编码器的推理模型。最近的方法利用了LLM的多轮特性，将FV视为一个逐步解决问题的过程，其中生成并回答需要额外背景信息的问题，直到有足够的信息做出决策。这一迭代方法使得验证过程更具合理性并可解释。尽管这些方法已经在百科知识声明上得到了测试，但对于特定领域和现实世界的声明的研究仍然缺失。在本文中，我们将在三个医学事实核查数据集上应用迭代FV系统，并使用多种设置进行评估，包括不同的LLM、外部网络搜索以及使用逻辑谓词进行结构化推理。我们展示了与传统方法相比，最终性能的改进，并展示了逐步FV系统在特定领域声明上的高潜力。