摘要
在皮肤病诊断领域,对皮肤镜和显微镜下皮肤病变图像的分析对于准确、早期发现各种疾病至关重要。然而,创建多样化、高质量的带标签数据集的成本高昂,阻碍了机器学习模型的准确性和泛化能力。我们提出了一种创新的无监督数据增强解决方案,利用基于生成对抗网络(GAN)的模型及其潜在空间中的相关技术,在皮肤镜图像中生成受控的半自动发现的语义变化。我们创建了合成图像来整合语义变化,并使用这些图像扩充训练数据。通过这种方法,我们能够提高机器学习模型的性能,并在 HAM10000 数据集上的皮肤病变分类中为非集成模型设定新的基准。我们还利用观察到的分析和生成的模型对模型的可解释性进行了详细研究,证实了我们解决方案的有效性。