LLM2D
DALK:基于动态协同增强的大语言模型与知识图谱的阿尔茨海默病科学文献问答系统
DALK: Dynamic Co-Augmentation of LLMs and KG to answer Alzheimer's Disease Questions with Scientific Literature
作者: Dawei Li, Shu Yang, Zhen Tan, Jae Young Baik, Sukwon Yun, Joseph Lee, Aaron Chacko, Bojian Hou, Duy Duong-Tran, Ying Ding, Huan Liu, Li Shen, Tianlong Chen
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2405.04819v3

摘要

大型语言模型 (LLM) 在各种应用中取得了令人瞩目的成果。然而,将长尾知识整合到 LLM 中的挑战仍然阻碍着 LLM 在专业领域的无缝应用。本文介绍了 DALK,即 LLM 和 KG 的动态协同增强,以解决这一局限性,并展示其在阿尔茨海默病 (AD) 研究中的能力,该研究是生物医学的一个专业子领域,也是全球健康优先事项。通过 LLM 和 KG 相互增强的协同框架,我们首先利用 LLM 从 AD 相关科学文献中构建一个不断发展的 AD 特定知识图谱 (KG),然后利用一种粗到细的采样方法,结合一种新颖的自我感知知识检索方法,从 KG 中选择合适的知识来增强 LLM 的推理能力。在构建的 AD 问答 (ADQA) 基准上进行的实验结果突出了 DALK 的有效性。此外,我们进行了一系列详细的分析,可以为 KG 和 LLM 相互增强的这一新兴主题提供宝贵的见解和指导。我们将发布代码和数据,地址为 https://github.com/David-Li0406/DALK。