LLM2D
使用预训练语言模型的多标签分类方法,从安全网精神病院的临床笔记中进行自杀表型分析
Suicide Phenotyping from Clinical Notes in Safety-Net Psychiatric Hospital Using Multi-Label Classification with Pre-Trained Language Models
作者: Zehan Li, Yan Hu, Scott Lane, Salih Selek, Lokesh Shahani, Rodrigo Machado-Vieira, Jair Soares, Hua Xu, Hongfang Liu, Ming Huang
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.18878v1

摘要

准确识别和分类自杀事件可以更好地预防自杀,减轻操作负担,提高高危精神科环境中的护理质量。预训练语言模型为从非结构化临床叙述中识别自杀倾向提供了希望。我们使用两种微调策略(多个单标签和单个多标签)评估了四个基于 BERT 的模型在从 500 个带注释的精神科评估记录中检测共存自杀事件的性能。这些记录被标记为自杀意念 (SI)、自杀企图 (SA)、自杀暴露 (ES) 和非自杀性自伤 (NSSI)。RoBERTa 使用二元关联优于其他模型(acc=0.86,F1=0.78)。MentalBERT (F1=0.74) 也优于 BioClinicalBERT (F1=0.72)。使用单个多标签分类器微调的 RoBERTa 进一步提高了性能(acc=0.88,F1=0.81),突出了在领域相关数据上预训练的模型和单个多标签分类策略提高了效率和性能。