LLM2D

摘要

arXiv:2503.18569v1 类别: cross 摘要: 不平衡数据表示一类（多数类）频率高于另一类（少数类）的一种分布。这种现象在各个领域中都存在，如安全、医疗护理和人类活动等领域。在不平衡学习中，分类算法通常倾向于准确分类多数类，导致人为提高准确率。因此，许多少数类样本被误标为多数类实例，从而产生偏向多数类的偏差。本文提出了一种基于边界锚样本的框架来应对不平衡学习的挑战。首先，我们选择并使用锚样本训练一个多层感知器（MLP）分类器，该分类器作为先验知识模型，并辅助对抗学习和对比学习过程。然后，我们设计了一个新的深度生成模型，称为锚稳定条件生成对抗网络或简称Anch-SCGAN。Anch-SCGAN配备了两个生成器，分别用于少数类和多数类，以及一个包含预训练特征提取器MLP的附加类特定信息的判别器。此外，我们通过两种方式来促进生成器的训练过程。首先，我们定义了一个基于重新处理锚样本和对比学习的新生成器损失函数。其次，我们应用了一种评分策略来稳定生成器中的对抗训练部分。我们在训练Anch-SCGAN时进一步使用了锚样本来提高生成样本的精度。对我们进行的16个真实世界的不平衡数据集实验表明，Anch-SCGAN在不平衡学习方面优于知名方法。