LLM2D
超越标签注意:通过字典学习实现自动医疗编码的语言模型透明性
Beyond Label Attention: Transparency in Language Models for Automated Medical Coding via Dictionary Learning
作者: John Wu, David Wu, Jimeng Sun
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2411.00173v2

摘要

arXiv:2411.00173v2 宣告类型: replace-cross 摘要:医学编码,即将非结构化的临床文本转换为标准化的医学代码,是一项至关重要但耗时的医疗实践。尽管大型语言模型(LLM)可以自动化编码过程并提高此类任务的效率,但可解释性对于维护患者信任仍然至关重要。当前在医学编码应用的可解释性努力主要依赖于标签注意力机制,这 often 领导到对与ICD代码无关的多余令牌(extraneous tokens)的突出显示。为了促进医学语言模型中的准确可解释性,本文利用字典学习方法,可以从稠密的语言模型嵌入中高效提取稀疏激活的表示。与常见的标签注意力机制相比,我们的模型通过构建可用于解释每个ICD代码预测的可解释字典,超越了基于令牌级别的表示,即使突出显示的令牌在医学上是无关的。我们展示了字典特征可以使模型行为偏向,阐述超过90%医无关联令牌隐藏的意义,并且是可由人类解读的。