LLM2D

摘要

arXiv:2505.00409v1 Announce Type: cross 摘要：自动脱敏技术对于病理语音数据的伦理共享至关重要，但它们的感知后果仍未受到充分研究。本研究提出了对脱敏病理语音进行全面的人本分析，使用了一种结构化的感知协议，涉及来自不同语言、临床和技术背景的十名德语使用者，包括母语者和非母语者。参与者评估了来自180名讲者的脱敏原话片段，这些讲者包括唇裂和腭裂、运动性失语症、构音障碍、发声障碍和年龄匹配的健康对照组。语音使用先进的自动脱敏方法进行了脱敏（错误率范围为30%-40%）。参与者在零样本（单次暴露）和少量样本（重复暴露）条件下完成了图灵风格的辨别和质量评分任务。总体而言，辨别准确率较高（零样本91%；少量样本93%），但不同障碍之间存在差异（重复测量方差分析：p=0.007），辨别准确率范围从96%（运动性失语症）到86%（发声障碍）。脱敏一致地降低了感知质量（从83%降至59%，p<0.001），具有特定于病理的降级模式（单因素方差分析：p=0.005）。母语者对原始语音的评分略高于非母语者（Δ=4%，p=0.199），但在脱敏后这种差异几乎消失（Δ=1%，p=0.724）。未观察到显著的性别偏见。最关键的是，人类感知结果与自动隐私或临床效用度量标准之间没有相关性。这些结果强调了需要基于听众反馈、特定于障碍和上下文的脱敏策略的重要性，这些策略在保护隐私的同时保持可解释性、交流功能和诊断效用，特别是在儿童等弱势群体中。