LLM2D
病理语音的自动化匿名化感知影响
Perceptual Implications of Automatic Anonymization in Pathological Speech
作者: Soroosh Tayebi Arasteh, Saba Afza, Tri-Thien Nguyen, Lukas Buess, Maryam Parvin, Tomas Arias-Vergara, Paula Andrea Perez-Toro, Hiu Ching Hung, Mahshad Lotfinia, Thomas Gorges, Elmar Noeth, Maria Schuster, Seung Hee Yang, Andreas Maier
发布日期: 5/2/2025
arXiv ID: oai:arXiv.org:2505.00409v1

摘要

arXiv:2505.00409v1 Announce Type: cross 摘要:自动脱敏技术对于病理语音数据的伦理共享至关重要,但它们的感知后果仍未受到充分研究。本研究提出了对脱敏病理语音进行全面的人本分析,使用了一种结构化的感知协议,涉及来自不同语言、临床和技术背景的十名德语使用者,包括母语者和非母语者。参与者评估了来自180名讲者的脱敏原话片段,这些讲者包括唇裂和腭裂、运动性失语症、构音障碍、发声障碍和年龄匹配的健康对照组。语音使用先进的自动脱敏方法进行了脱敏(错误率范围为30%-40%)。参与者在零样本(单次暴露)和少量样本(重复暴露)条件下完成了图灵风格的辨别和质量评分任务。总体而言,辨别准确率较高(零样本91%;少量样本93%),但不同障碍之间存在差异(重复测量方差分析:p=0.007),辨别准确率范围从96%(运动性失语症)到86%(发声障碍)。脱敏一致地降低了感知质量(从83%降至59%,p<0.001),具有特定于病理的降级模式(单因素方差分析:p=0.005)。母语者对原始语音的评分略高于非母语者(Δ=4%,p=0.199),但在脱敏后这种差异几乎消失(Δ=1%,p=0.724)。未观察到显著的性别偏见。最关键的是,人类感知结果与自动隐私或临床效用度量标准之间没有相关性。这些结果强调了需要基于听众反馈、特定于障碍和上下文的脱敏策略的重要性,这些策略在保护隐私的同时保持可解释性、交流功能和诊断效用,特别是在儿童等弱势群体中。