LLM2D
知微调:面向大型语言模型的知识感知微调
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models
作者: Yougang Lyu, Lingyong Yan, Shuaiqiang Wang, Haibo Shi, Dawei Yin, Pengjie Ren, Zhumin Chen, Maarten de Rijke, Zhaochun Ren
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2402.11176v3

摘要

尽管在大语言模型在许多自然语言处理(NLP)任务中取得了成功,但它们在知识密集型任务中仍然难以有效地利用知识,表现出诸如生成不完整、非事实或不合逻辑的答案等局限性。这些局限性源于大语言模型在普通微调期间缺乏对知识的意识。为了解决这些问题,我们提出了一种知识感知微调(KnowTuning)方法,以提高大语言模型对细粒度和粗粒度知识的意识。我们设计了一个细粒度知识增强阶段,以训练大语言模型识别答案中难以获取的细粒度知识。我们还提出一个粗粒度知识比较阶段,以训练大语言模型从三个方面区分可靠和不可靠的知识:完整性、真实性和逻辑性。在通用和医疗问答(QA)数据集上进行的大量实验通过自动和人工评估验证了 KnowTuning 的有效性,涵盖了各种规模的大语言模型。我们进一步验证了 KnowTuning 在细粒度事实评估下能够生成更多的事实,并且事实错误率更低。