LLM2D
帕金森病分类的创新语音深度学习方法:系统综述
Innovative Speech-Based Deep Learning Approaches for Parkinson's Disease Classification: A Systematic Review
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2407.17844v4

摘要

帕金森病(PD)是全球第二大常见的神经退行性疾病,患者在疾病早期阶段常出现言语障碍。近年来,人工智能(AI),特别是深度学习(DL)技术的进步,通过分析语音数据显著提高了PD的诊断水平。然而,研究进展受到公开可访问的基于语音的PD数据集有限的限制,这主要是由于隐私问题。本系统综述旨在基于2020年1月至2024年3月期间发表的33篇科学文献,探索目前基于语音的DL方法在PD分类中的应用现状。我们讨论了其可用资源、功能和潜在局限性,以及与偏差、可解释性和隐私相关的问题。此外,本综述概述了公开可访问的基于语音的PD数据集和开源材料。已识别的DL方法被分为端到端(E2E)学习、迁移学习(TL)和深度声学特征提取(DAFE)。在E2E方法中,卷积神经网络(CNN)较为普遍,但Transformer越来越受欢迎。E2E方法面临着数据和计算资源有限的挑战,尤其是在使用Transformer时。TL通过提供更强大的PD诊断和跨语言更好的泛化能力来解决这些问题。DAFE旨在通过检查深度特征对其他DL方法和更传统机器学习(ML)方法的具体影响来提高结果的可解释性和可理解性。然而,它通常比E2E和TL方法表现得差。