LLM2D

摘要

arXiv:2504.06897v1 Announce Type: cross 摘要：本文介绍了MedSegFactory，这是一个多用途的医疗合成框架，能够生成跨模态和任务的高质量配对医疗图像和分割掩码。其目标是作为无限的数据仓库，提供图像-掩码配对以增强现有的分割工具。MedSegFactory的核心是一个双流扩散模型，其中一个流生成医疗图像，另一个流生成相应的分割掩码。为了确保图像-掩码配对的精确对齐，我们引入了联合交叉注意（JCA），通过流之间的动态跨条件化实现协作去噪。这种双向交互使得两种表示可以相互引导生成过程，增强生成配对的一致性。通过用户定义的提示，MedSegFactory可以按需生成配对的医疗图像和分割掩码，这些提示可以指定目标标签、成像模态、解剖区域和病理条件，从而实现可扩展和高质量的数据生成。这一新的医疗图像合成范式能够无缝集成到各种医疗成像流程中，提升效率和准确性。广泛实验表明，MedSegFactory生成的数据质量优异且具有实用性，在2D和3D分割任务中实现了竞争力或最先进的性能，同时还解决了数据稀缺性和监管限制问题。