摘要
arXiv:2502.01655v1 类型: 综合
摘要:集成技术与欠采样技术都是处理不平衡数据集分类问题的有效工具。本文提出了一种结合集成学习优势进行分类器偏向化和一种新型欠采样方法的新型集成方法。欠采样方法名为二元PSO实例选择法;它与集成分类器结合在一起,寻找最合适的较大类样本的长度和组合,以构建一个包含少数类样本的新数据集。本文提出的方法采用了多目标策略,该方法的贡献在于显著提高了不平衡分类性能,并同时最大程度地保证了原始数据集的完整性。我们对提出的该方法进行了实验,并将其性能与其他几种传统的基本集成方法进行了比较。我们还在二元PSO实例选择框架中使用了改进版本的这些不平衡数据集进行实验。根据实验结果,我们提出的方法优于单一集成方法、最先进的欠采样方法,以及传统PSO实例选择算法与其他方法的组合。