LLM2D
MedSegFactory:文本引导的医学图像-掩码对生成
MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs
作者: Jiawei Mao, Yuhan Wang, Yucheng Tang, Daguang Xu, Kang Wang, Yang Yang, Zongwei Zhou, Yuyin Zhou
发布日期: 4/10/2025
arXiv ID: oai:arXiv.org:2504.06897v1

摘要

arXiv:2504.06897v1 Announce Type: cross 摘要:本文介绍了MedSegFactory,这是一个多用途的医疗合成框架,能够生成跨模态和任务的高质量配对医疗图像和分割掩码。其目标是作为无限的数据仓库,提供图像-掩码配对以增强现有的分割工具。MedSegFactory的核心是一个双流扩散模型,其中一个流生成医疗图像,另一个流生成相应的分割掩码。为了确保图像-掩码配对的精确对齐,我们引入了联合交叉注意(JCA),通过流之间的动态跨条件化实现协作去噪。这种双向交互使得两种表示可以相互引导生成过程,增强生成配对的一致性。通过用户定义的提示,MedSegFactory可以按需生成配对的医疗图像和分割掩码,这些提示可以指定目标标签、成像模态、解剖区域和病理条件,从而实现可扩展和高质量的数据生成。这一新的医疗图像合成范式能够无缝集成到各种医疗成像流程中,提升效率和准确性。广泛实验表明,MedSegFactory生成的数据质量优异且具有实用性,在2D和3D分割任务中实现了竞争力或最先进的性能,同时还解决了数据稀缺性和监管限制问题。