LLM2D
MediSyn:一个通用的文本引导潜空间扩散模型,用于多样的医学图像合成
MediSyn: A Generalist Text-Guided Latent Diffusion Model For Diverse Medical Image Synthesis
作者: Joseph Cho, Mrudang Mathur, Cyril Zakka, Dhamanpreet Kaur, Matthew Leipzig, Alex Dalal, Aravind Krishnan, Eubee Koo, Karen Wai, Cindy S. Zhao, Rohan Shad, Robyn Fong, Ross Wightman, Akshay Chaudhari, William Hiesinger
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2405.09806v4

摘要

arXiv:2405.09806v4 宣告类型: 替换交叉 摘要:深度学习算法需要大量的数据才能实现稳健的表现。然而,在医疗领域,由于患者隐私问题,数据的可用性往往受到限制。合成数据可能解决这些挑战。最近,图像生成模型在医疗应用中越来越受欢迎,但它们往往专用于单一的医学专科和成像模态,从而限制了它们的广泛应用。为了解决这个问题,我们引入了MediSyn:一种文本引导的潜在扩散模型,能够从6个医学专科和10种图像类型生成合成图像。合成图像由专家临床医生验证,以确保它们与相应的文本提示对齐。此外,合成图像与真实图像的直接对比确认了我们的模型能够生成新颖的图像,并且最关键的是可能保护患者隐私。最后,基于合成数据和真实数据混合训练的分类器在性能上与基于两倍真实数据训练的分类器相当。我们的 findings 突显了通用图像生成模型在加速医学中的算法研究和开发方面的巨大潜力。