LLM2D

摘要

arXiv:2502.08754v1 类型: cross 摘要：细胞实例的精确分割和分类对于分析组织微环境在组织学图像中的重要性、支持医学诊断、预后、治疗规划以及大脑细胞建筑的研究至关重要。然而，创建用于训练的高质量标注数据集仍然是一个主要挑战。本研究介绍了一种新颖的一阶段方法（HistoSmith），用于生成图像-标签对以扩充组织学数据集。不同于当前最先进的方法，这些方法使用分别用于标签和图像生成的扩散模型，我们的方法采用潜在扩散模型来学习细胞布局、分类掩码和组织学图像的联合分布。该模型可以通过条件参数（如细胞类型、数量和组织类型）进行定制化数据生成。在Conic H&E组织病理学数据集和Nissl染色CytoDArk0数据集上进行训练后，该模型生成了逼真且多样的标注样本。实验结果表明，在Conic数据集中的未被充分代表的细胞类型（如中性粒细胞）的细胞实例分割和分类方面有所改进。这些发现突显了我们方法解决数据稀缺挑战的潜力。