摘要
arXiv:2404.09077v3 Announce Type: replace-cross
摘要:大型语言模型(LLMs)在开放式领域问题回答方面取得了显著成果。然而,它们仍然面临着幻觉和知识截止时间等挑战。这些问题可以通过上下文学习得到缓解,即在生成答案之前为LLMs提供相关背景信息。近期文献提出了知识图谱提示(KGP),将知识图谱与基于LLM的遍历代理相结合,大大提升了文档检索质量。然而,KGP需要大量数据集进行昂贵的微调,并且仍然容易产生幻觉。在本文中,我们提出了一种增强方法——CuriousLLM,该方法将好奇心驱动的推理机制整合到了LLM代理中。该机制使代理能够生成相关后续问题,从而更有效地引导信息检索过程。我们方法的核心在于开发了一个新的Follow-upQA数据集,该数据集包括问题和支持证据作为输入,并且后续问题作为事实标准。实验结果显示,CuriousLLM在多文档问答(MD-QA)中的性能显著提升,避免了原KGP框架中所面临的大量计算成本和延迟问题。