摘要
arXiv:2502.02277v1 类型: cross
摘要: 在现实世界的回归任务中,数据集经常表现出不平衡分布的特征,具体表现为在高复杂度区域数据稀缺,在低复杂度区域数据丰富。这种不平衡对具有清晰类别边界的现有分类方法构成了重大挑战,同时突显了专门针对不平衡回归问题的方法的稀缺性。为了更好地应对这些挑战,我们引入了一种新的不平衡回归概念,该概念同时考虑了问题的复杂性和数据点的密度,超越了传统仅关注数据密度的定义。此外,我们提出了一种错误分布光滑(EDS)的方法来应对不平衡回归问题,该方法有效地从数据集中选择一个代表性的子集,减少了冗余同时保持平衡和代表性。通过多项实验,EDS 显示了其有效性,相关的代码和数据集可以通过 https://anonymous.4open.science/r/Error-Distribution-Smoothing-762F 访问。