摘要
自闭症谱系障碍(ASD)是一种普遍性发育障碍,严重影响个体的日常生活功能和社会参与。尽管大量研究集中在支持ASD的临床诊断上,但在基于大型语言模型(LLM)的方法领域,特别是关于基于第二版自闭症诊断观察量表(ADOS-2)的真实世界临床诊断场景的研究仍然缺乏系统性和全面性。因此,我们提出了一种名为ADOS-Copilot的框架,该框架在评分和解释之间取得了平衡,并探讨了影响LLM在此任务中性能的因素。实验结果表明,我们提出的框架与临床医生的诊断结果具有竞争力,最小平均绝对误差为0.4643,二元分类F1分数为81.79%,三元分类F1分数为78.37%。此外,我们从ADOS-2、LLM的能力、语言和模型规模等角度系统地阐明了当前LLM在此任务中的优势和局限性,旨在激励和指导LLM在更广泛的精神健康障碍领域的未来应用。我们希望有更多研究能够转化为真正的临床实践,为特立独行的孩子打开一扇友善之窗。