LLM2D
KBAlign:高效的特定知识库自适应方法
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases
作者: Zheni Zeng, Yuxuan Chen, Shi Yu, Yukun Yan, Zhenghao Liu, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14790v2

摘要

大型语言模型 (LLM) 通常依赖于检索增强生成来即时利用知识材料,或者需要外部信号(例如人类偏好数据和更强的 LLM 注解)来进行知识适应。为了释放 LLM 的自学习潜力,我们提出了 KBAlign,这是一种旨在高效适应涉及知识库的下游任务的方法。我们的方法利用迭代训练和自我标注数据(例如问答对和修改建议),使模型能够高效地掌握知识内容。在多个数据集上的实验结果证明了我们方法的有效性,显著提高了下游任务中的模型性能,这些任务需要以低成本获得特定知识。值得注意的是,我们的方法实现了使用 GPT-4-turbo 注解所能获得的性能提升的 90% 以上,同时完全依赖于自监督学习。我们向社区发布了我们的实验数据、模型和过程分析,以供进一步探索 (https://github.com/thunlp/KBAlign)。