LLM2D
iCost:一种基于实例复杂度的新型成本敏感学习框架,用于不平衡分类
iCost: A Novel Instance Complexity Based Cost-Sensitive Learning Framework for Imbalanced Classification
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13007v1

摘要

数据中的类别不平衡对分类任务提出了重大挑战。这种情况相当常见,需要谨慎处理以获得理想的性能。传统的分类算法往往偏向多数类。缓解这种情况的一种方法是使分类器具有成本敏感性。这是通过为少数类实例分配更高的误分类成本来实现的。这种实现的一个问题是,所有少数类实例都被同等对待,并分配相同的惩罚值。然而,所有实例的学习难度并不相同。位于决策边界附近的实例更难分类,而那些远离边界的实例则更容易分类。如果不考虑实例复杂性,简单地对所有少数类样本进行均匀加权,会导致不必要的偏差,从而导致多数类实例的误分类数量增加。这是不可取的,为了克服这种情况,我们在本研究中提出了一种基于实例复杂性的成本敏感方法。我们首先根据难度级别对所有少数类实例进行分类,然后相应地对实例进行惩罚。这确保了更公平的实例加权,并防止过度惩罚。所提出的方法在66个不平衡数据集上与传统的成本敏感学习框架进行了测试,性能显著提高,证明了我们方法的有效性。