摘要
我们研究了置信预测(一种强大的不确定性量化工具)对标签噪声的鲁棒性。我们的分析同时处理回归和分类问题,描述了何时以及如何构建能够正确覆盖未观察到的无噪声真实标签的不确定性集。我们进一步扩展了我们的理论,并制定了使用噪声标签正确控制一般损失函数(例如假阴性比例)的要求。我们的理论和实验表明,只要噪声是分散的并增加了可变性,具有噪声标签的置信预测和风险控制技术就能在干净的真实标签上获得保守的风险。在其他对抗性情况下,我们也可以校正置信预测算法中大小有限的噪声,以确保在没有分数或数据规律性的情况下实现真实标签的正确风险。