摘要
arXiv:2502.04394v1 Announce Type: cross
摘要:阿尔茨海默病(AD)是一种不可逆的神经退行性疾病,全球有5000万人受到影响。低成本、准确地识别AD的关键标志物对于及时诊断和干预至关重要。语言能力受损是认知衰退的最早迹象之一,可用于区分AD患者和正常对照个体。患者-访谈者对话可能用于检测这些障碍,但由于其中常夹杂模糊、噪声和无关的信息,使得AD检测任务困难重重。此外,AD语音样本的有限可用性和其语音风格的变化导致在开发稳健的基于语音的AD检测模型上面临重大挑战。为了解决这些挑战,我们提出了一种新颖的基于语音的领域特定方法DECT,该方法利用大型语言模型(LLMs)进行精细的语言分析,并生成标签转换且保留标签的数据集。我们的研究提出了四个创新点:我们利用LLMs的总结能力,从嘈杂的语音转录中识别和提炼关键的认知语言信息,有效过滤无关信息。我们利用LLMs内在的语言知识,从非结构化和异构的音频转录中提取语言标记。我们利用LLMs的组合能力生成包含多种语言模式的AD语音转录,以克服语音数据稀缺的问题,提高AD检测模型的稳健性。我们使用增补的AD文本语音转录数据集和更精细的AD文本语音转录数据表示来微调AD检测模型。结果显示,与基准模型相比,DECT在DementiaBank数据集上的AD检测准确性提高了11%。