LLM2D

摘要

arXiv:2411.00173v2 宣告类型: replace-cross 摘要：医学编码，即将非结构化的临床文本转换为标准化的医学代码，是一项至关重要但耗时的医疗实践。尽管大型语言模型（LLM）可以自动化编码过程并提高此类任务的效率，但可解释性对于维护患者信任仍然至关重要。当前在医学编码应用的可解释性努力主要依赖于标签注意力机制，这 often 领导到对与ICD代码无关的多余令牌（extraneous tokens）的突出显示。为了促进医学语言模型中的准确可解释性，本文利用字典学习方法，可以从稠密的语言模型嵌入中高效提取稀疏激活的表示。与常见的标签注意力机制相比，我们的模型通过构建可用于解释每个ICD代码预测的可解释字典，超越了基于令牌级别的表示，即使突出显示的令牌在医学上是无关的。我们展示了字典特征可以使模型行为偏向，阐述超过90%医无关联令牌隐藏的意义，并且是可由人类解读的。