LLM2D

摘要

准确识别和分类自杀事件可以带来更好的自杀预防措施，减少操作负担，并提高高危精神科环境中的护理质量。预训练语言模型为从非结构化临床叙述中识别自杀倾向提供了希望。我们使用两种微调策略（多个单标签和单个多标签）评估了四个基于 BERT 的模型的性能，用于从 500 个带注释的精神科评估笔记中检测共存的自杀事件。这些笔记被标记为自杀意念 (SI)、自杀企图 (SA)、自杀暴露 (ES) 和非自杀性自伤 (NSSI)。RoBERTa 使用多个单标签分类策略（acc=0.86，F1=0.78）优于其他模型。MentalBERT (acc=0.83, F1=0.74) 也超过了 BioClinicalBERT (acc=0.82, F1=0.72)，后者优于 BERT (acc=0.80, F1=0.70)。使用单个多标签分类微调的 RoBERTa 进一步提高了模型性能 (acc=0.88, F1=0.81)。这些发现表明，模型优化、使用领域相关数据进行预训练以及单个多标签分类策略可以提高自杀表型模型的性能。