LLM2D

摘要

arXiv:2504.05571v1 宣布类型：交叉摘要：尽管大型语言模型（LLMs）在预训练过程中获得了大量的知识，但它们往往缺乏特定领域的新信息或专业信息。持续预训练（CPT）试图解决这一问题，但却面临灾难性遗忘和低数据环境下的低效率问题。我们提出了知识指令（Knowledge-Instruct）这一新型方法，以高效地通过纯粹的指令调优从有限的语料库中注入知识。通过生成信息密集型的合成指令数据，它有效地整合了新知识，同时保持了通用的推理和指令遵循能力。知识指令展示了出色的事实记忆能力，最小化了灾难性遗忘，并通过利用相对较小的语言模型的合成数据保持了可扩展性。此外，它还增强了上下文理解，包括复杂的多跳推理，从而促进了与检索系统的集成。我们通过多样化的基准测试验证了其有效性，包括一个新发布的数据集Companies，用于衡量知识注入能力。