LLM2D
全面头部MRI去标识化的陷阱:基于扩散模型的重新识别风险与研究潜力受损
Pitfalls of defacing whole-head MRI: re-identification risk with diffusion models and compromised research potential
作者: Chenyu Gao, Kaiwen Xu, Michael E. Kim, Lianrui Zuo, Zhiyuan Li, Derek B. Archer, Timothy J. Hohman, Ann Zenobia Moore, Luigi Ferrucci, Lori L. Beason-Held, Susan M. Resnick, Christos Davatzikos, Jerry L. Prince, Bennett A. Landman
发布日期: 2/3/2025
arXiv ID: oai:arXiv.org:2501.18834v1

摘要

arXiv:2501.18834v1 宣布类型: cross 摘要: 在公共发布前,常对头部磁共振成像(MRI)数据集进行篡改,以解决隐私问题。对面部和附近体素的修改引发了关于这些技术真正保护隐私的能力及其对下游任务影响的讨论。随着深度生成模型的发展,篡改保护隐私的程度变得不确定。此外,虽然已知篡改的体素包含有价值的人体解剖信息,但它们支持超过直接受影响的解剖区域之外的研究的可能性仍然不确定。为了评估这些考虑,我们开发了一个回脸流水线,使用级联扩散概率模型(DPMs)从篡改后的头部MRI中恢复面部。DPMs在180名受试者的图像上进行训练,并在484名未见过的受试者的图像上进行测试,其中469名来自不同的数据集。为了评估篡改过程中修改的体素是否包含普遍有用的信息,我们还从篡改和原始MRI的面部体素中预测了CT衍生的骨骼肌肉放射密度。结果显示,DPMs能够生成高保真度的面部,这些面部与篡改图像中的原始面部相似,其表面距离显著小于一般人群平均面部的距离(p<0.05)。此外,这种性能在以前未见过的数据集中也能很好地推广。对于骨骼肌肉放射密度预测,使用篡改的图像比使用原始图像的结果显著较差(p<10^-4)。对于小腿肌肉,当使用原始图像时,相关性在统计上显著(p<0.05),但应用任何篡改方法时,相关性不统计显著(p>0.05),这表明篡改不仅可能无法保护隐私,还可能消除有价值的信息。