LLM2D

摘要

arXiv:2404.08064v4 Announce Type: replace-cross 摘要: 将语音整合到医疗保健中加剧了隐私问题，因为语音作为包含个人生物识别信息的非侵入性生物标志物具有潜在价值。为此，说话人匿名化旨在隐藏个人身份信息的同时保留关键的语言内容。然而，将匿名化技术应用于病理性语音，这一隐私尤为重要的领域，尚未得到广泛研究。本研究调查了匿名化对来自多个德国机构的2700多名病理性语音的影响，重点关注隐私、病理性效用和人口统计公平性。我们探讨了基于深度学习和信号处理的匿名化方法。我们记录了显著的隐私改进——通过等错误率增加高达1933%来证明，对整体效用的影响最小。具体疾病如构音障碍、发声障碍和唇腭裂的效用变化最小，而失语症则显示出轻微改善。我们的研究结果强调，匿名化对不同疾病的影响差异很大。这需要针对特定疾病的匿名化策略，以最佳平衡隐私与诊断效用。此外，我们的公平性分析显示，大多数人口统计群体的匿名化效果一致。本研究展示了匿名化在病理性语音中增强隐私的有效性，同时强调了定制化和针对特定疾病方法的重要性，以应对逆向攻击。