LLM2D

摘要

神经网络在学习偏差和误导性相关性时，难以进行图像分类，这会影响其泛化能力和性能。以往的方法需要属性标签（例如背景、颜色）或利用生成对抗网络 (GAN) 来减轻偏差。我们引入了 DiffuBias，这是一种用于文本到图像生成的新型管道，它通过生成偏差冲突样本增强分类器的鲁棒性，而无需在生成阶段进行训练。DiffuBias 利用预训练的扩散模型和图像字幕模型，利用来自有偏差分类器 ($f_B$) 的 top-$K$ 损失来创建更具代表性的数据样本，从而生成挑战分类器偏差的图像。这种方法不仅有效地去除了偏差，而且还增强了分类器的泛化能力。据我们所知，DiffuBias 是首个利用稳定扩散模型在去偏差任务中生成偏差冲突样本的方法。我们全面的实验评估表明，DiffuBias 在基准数据集上取得了最先进的性能。我们还对各种生成模型的碳排放和能源消耗进行了比较分析，以突出计算效率的重要性。