LLM2D

摘要

大型语言模型 (LLM) 在各种应用中取得了令人瞩目的成果。然而，将长尾知识整合到 LLM 中的挑战仍然阻碍着 LLM 在专业领域的无缝应用。本文介绍了 DALK，即 LLM 和 KG 的动态协同增强，以解决这一局限性，并展示其在阿尔茨海默病 (AD) 研究中的能力，该研究是生物医学的一个专业子领域，也是全球健康优先事项。通过 LLM 和 KG 相互增强的协同框架，我们首先利用 LLM 从 AD 相关科学文献中构建一个不断发展的 AD 特定知识图谱 (KG)，然后利用一种粗到细的采样方法，结合一种新颖的自我感知知识检索方法，从 KG 中选择合适的知识来增强 LLM 的推理能力。在构建的 AD 问答 (ADQA) 基准上进行的实验结果突出了 DALK 的有效性。此外，我们进行了一系列详细的分析，可以为 KG 和 LLM 相互增强的这一新兴主题提供宝贵的见解和指导。我们将发布代码和数据，地址为 https://github.com/David-Li0406/DALK。