LLM2D

摘要

arXiv:2502.07184v1 交叉学科类型: 摘要: 如何缓解大型语言模型（LLMs）的幻觉一直是LLMs研究社区追求的基本目标。经过大量关于幻觉的相关研究，一种主流的方法是通过优化LLMs的知识表示来改变它们的输出，从而减少幻觉。鉴于这些工作的核心关注点是模型获得的知识，而知识长期以来一直是人类社会进步的核心主题，我们认为模型提炼知识的过程可以从人类的学习方式中大大受益。在我们的工作中，通过模仿人类的学习过程，我们设计了一种适应性对比学习策略。该方法根据LLMs实际掌握的知识，灵活构建不同的正样本和负样本进行对比学习。这种策略有助于LLMs巩固它们已经掌握的正确知识，加深对已遇到但尚未完全掌握的正确知识的理解，忘记之前学过的错误知识，并诚实地承认自己缺乏的知识。在广泛使用的数据集上的大量实验和详细的分析表明了我们方法的有效性。