摘要
arXiv:2504.10421v1 交叉领域类型
摘要:知识编辑作为一种通过修改大型语言模型(LLMs)的内部知识来更新它们的有效方法已经浮出水面。然而,将这种方法应用于生物医学领域面临着独特的挑战,因为生物医学知识的分布呈长尾状,罕见且不常用的资料占主导地位。在本文中,我们首次进行全面研究,探讨知识编辑方法在编辑长尾生物医学知识方面的有效性。结果表明,虽然现有的编辑方法能够提升LLMs在长尾生物医学知识上的性能,但它们在处理长尾知识方面的表现仍然不如处理高频流行知识,即便进行了编辑。我们进一步的分析揭示,长尾生物医学知识包含了大量的“一到多”知识,即一个主题和关系链接到多个对象。这种“一到多”知识的高普及率限制了知识编辑方法在提高LLMs对长尾生物医学知识理解方面的效果,突显了需要针对这种表现差距制定特殊策略的必要性。