LLM2D

摘要

arXiv:2504.01216v1 交叉公告类型摘要：创伤后应激障碍（PTSD）在临床环境中仍然被低估，为自动化检测识别患者提供了机会。本研究评估了自然语言处理方法在从临床访谈记录中检测PTSD方面的效果。我们使用DAIC-WOZ数据集比较了一般模型和精神健康特定模型（BERT/RoBERTa）、嵌入式方法（SentenceBERT/LLaMA）以及大型语言模型提示策略（零样本/少样本/链式推理）。特定领域模型显著优于通用模型（Mental-RoBERTa的F1值为0.643，而RoBERTa-base的F1值为0.485）。使用神经网络结合LLaMA嵌入实现了最高的性能（F1值为0.700）。仅使用DSM-5标准进行零样本提示也取得了竞争力的结果，无需训练数据（F1值为0.657）。性能在不同症状严重程度和共病状况下差异显著，对于重度PTSD病例和合并有抑郁症的患者具有更高的准确性。我们的研究结果突显了领域适应嵌入和大型语言模型在可扩展筛查方面的潜力，同时也强调了改进对复杂表现检测的必要性，并为开发临床可行的PTSD评估AI工具提供了见解。