LLM2D

摘要

arXiv:2411.03883v3 宣告类型: replace-cross 摘要: 问答是一个自然语言理解任务，涉及对显式上下文和未陈述的相关领域知识的推理。尽管训练成本高昂，大多数现代问答系统的骨干——大型语言模型（LLMs）——仍然难以可靠地捕捉医学等专门领域中概念之间微妙的关系。在这项工作中，我们提出了一种参数高效的医学知识增强LLM方法——MEG。MEG使用一个轻量级映射网络将知识图谱嵌入引入LLM，使其能够以经济有效的方式利用外部知识。我们使用四种流行的医学多项选择数据集评估了该方法，并表明LLMs 既能有效地解释知识图谱嵌入，又能从这些嵌入提供的事实依据中获得显著优势。MEG在BioMistral-7B和MediTron-7B这类专门模型上分别实现了6.7%和9.9%的平均准确率提升。最后，我们展示了MEG的性能对图编码器的选择具有鲁棒性。