LLM2D

摘要

尽管在大语言模型在许多自然语言处理（NLP）任务中取得了成功，但它们在知识密集型任务中仍然难以有效地利用知识，表现出诸如生成不完整、非事实或不合逻辑的答案等局限性。这些局限性源于大语言模型在普通微调期间缺乏对知识的意识。为了解决这些问题，我们提出了一种知识感知微调（KnowTuning）方法，以提高大语言模型对细粒度和粗粒度知识的意识。我们设计了一个细粒度知识增强阶段，以训练大语言模型识别答案中难以获取的细粒度知识。我们还提出一个粗粒度知识比较阶段，以训练大语言模型从三个方面区分可靠和不可靠的知识：完整性、真实性和逻辑性。在通用和医疗问答（QA）数据集上进行的大量实验通过自动和人工评估验证了 KnowTuning 的有效性，涵盖了各种规模的大语言模型。我们进一步验证了 KnowTuning 在细粒度事实评估下能够生成更多的事实，并且事实错误率更低。