LLM2D
MediSyn:一种通用的文本引导潜在扩散模型,用于多样的医学图像合成
MediSyn: A Generalist Text-Guided Latent Diffusion Model For Diverse Medical Image Synthesis
作者: Joseph Cho, Mrudang Mathur, Cyril Zakka, Dhamanpreet Kaur, Matthew Leipzig, Alex Dalal, Aravind Krishnan, Eubee Koo, Karen Wai, Cindy S. Zhao, Rohan Shad, Robyn Fong, Ross Wightman, Akshay Chaudhari, William Hiesinger
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2405.09806v3

摘要

arXiv:2405.09806v3 宣告类型: replace-cross 摘要:深度学习算法需要大量的数据以实现稳健的性能。然而,在医疗领域,由于患者隐私的顾虑,数据的可用性常常受到限制。合成数据为解决这些挑战提供了一种可能的解决方案。近年来,图像生成模型在医疗应用中得到了越来越多的应用,但这些模型通常仅针对单一的医疗专科和成像模态进行设计,从而限制了其更广泛的应用。为了解决这个问题,我们提出了MediSyn:一种文本引导的潜在扩散模型,能够从6个医疗专科和10种图像类型生成合成图像。合成图像通过专家临床医生的认证,以确保其与对应的文本提示相匹配。此外,合成图像与真实图像的直接比较表明,我们的模型能够生成新颖的图像,并且至关重要的是,可能保护患者隐私。最后,使用合成数据和真实数据混合训练的分类器在性能上与使用两倍真实数据训练的分类器相当。我们的发现强调了通用图像生成模型在加速医学领域算法研究和开发方面的巨大潜力。