LLM2D

摘要

自闭症谱系障碍（ASD）是一种普遍性发育障碍，严重影响个体的日常生活功能和社会参与。尽管大量研究集中在支持ASD的临床诊断上，但在基于大型语言模型（LLM）的方法领域，特别是关于基于第二版自闭症诊断观察量表（ADOS-2）的真实世界临床诊断场景的研究仍然缺乏系统性和全面性。因此，我们提出了一种名为ADOS-Copilot的框架，该框架在评分和解释之间取得了平衡，并探讨了影响LLM在此任务中性能的因素。实验结果表明，我们提出的框架与临床医生的诊断结果具有竞争力，最小平均绝对误差为0.4643，二元分类F1分数为81.79%，三元分类F1分数为78.37%。此外，我们从ADOS-2、LLM的能力、语言和模型规模等角度系统地阐明了当前LLM在此任务中的优势和局限性，旨在激励和指导LLM在更广泛的精神健康障碍领域的未来应用。我们希望有更多研究能够转化为真正的临床实践，为特立独行的孩子打开一扇友善之窗。