LLM2D

摘要

帕金森病（PD）是全球第二大常见的神经退行性疾病，患者在疾病早期阶段常出现言语障碍。近年来，人工智能（AI），特别是深度学习（DL）技术的进步，通过分析语音数据显著提高了PD的诊断水平。然而，研究进展受到公开可访问的基于语音的PD数据集有限的限制，这主要是由于隐私问题。本系统综述旨在基于2020年1月至2024年3月期间发表的33篇科学文献，探索目前基于语音的DL方法在PD分类中的应用现状。我们讨论了其可用资源、功能和潜在局限性，以及与偏差、可解释性和隐私相关的问题。此外，本综述概述了公开可访问的基于语音的PD数据集和开源材料。已识别的DL方法被分为端到端（E2E）学习、迁移学习（TL）和深度声学特征提取（DAFE）。在E2E方法中，卷积神经网络（CNN）较为普遍，但Transformer越来越受欢迎。E2E方法面临着数据和计算资源有限的挑战，尤其是在使用Transformer时。TL通过提供更强大的PD诊断和跨语言更好的泛化能力来解决这些问题。DAFE旨在通过检查深度特征对其他DL方法和更传统机器学习（ML）方法的具体影响来提高结果的可解释性和可理解性。然而，它通常比E2E和TL方法表现得差。