LLM2D

摘要

arXiv:2505.00032v1 交叉类型公告摘要：全球有超过3亿人受到重度抑郁症（MDD）的影响，突显出一个重要的公共卫生问题。然而，医疗资源分配的不均衡和诊断方法的复杂性导致了在许多国家和地区对这一疾病的关注不足。本文介绍了一种高性能的MDD诊断工具——MDD-LLM，这是一种以人工智能为导向的框架，利用了微调的大语言模型（LLMs）和大量的现实世界样本，以应对MDD诊断中的挑战。因此，我们从英国生物银行队列中选择了274,348个个体信息进行训练和评估所提出的方法。具体而言，我们从英国生物银行队列中选择了274,348个个体记录，并设计了表格数据转换方法，以创建一个大型语料库来进行训练和评估所提出的方法。为了展示MDD-LLM的优势，我们在多个评估指标上进行了全面的实验，并与现有的基于模型的解决方案进行了多项比较分析。实验结果表明，MDD-LLM（70B）达到了0.8378的准确率和0.8919的AUC（95% CI：0.8799 - 0.9040），显著优于现有用于MDD诊断的机器学习和深度学习框架。鉴于在MDD诊断中对LLMs的探索有限，我们研究了可能影响我们所提方法性能的各种因素，如表格数据转换技术和不同的微调策略。