LLM2D

摘要

大型语言模型 (LLM) 通常依赖于检索增强生成来即时利用知识材料，或者需要外部信号（例如人类偏好数据和更强的 LLM 注解）来进行知识适应。为了释放 LLM 的自学习潜力，我们提出了 KBAlign，这是一种旨在高效适应涉及知识库的下游任务的方法。我们的方法利用迭代训练和自我标注数据（例如问答对和修改建议），使模型能够高效地掌握知识内容。在多个数据集上的实验结果证明了我们方法的有效性，显著提高了下游任务中的模型性能，这些任务需要以低成本获得特定知识。值得注意的是，我们的方法实现了使用 GPT-4-turbo 注解所能获得的性能提升的 90% 以上，同时完全依赖于自监督学习。我们向社区发布了我们的实验数据、模型和过程分析，以供进一步探索 (https://github.com/thunlp/KBAlign)。