LLM2D

摘要

不确定性量化对于解释机器学习算法在高影响力应用中的不完美预测至关重要。一致性预测 (CP) 是一种强大的不确定性量化框架，它可以生成具有有效覆盖率的校准预测区间。在这项工作中，我们研究了 CP 区间如何受到偏差的影响——预测与真实值之间的系统偏差——这种现象在许多现实世界应用中普遍存在。我们研究了偏差对两种不同类型调整的区间长度的影响——对称调整，即对区间两侧进行相同调整的传统方法，以及非对称调整，一种更灵活的方法，可以对区间在正方向或负方向进行不等调整。我们通过理论和实证分析来描述对称和非对称调整如何影响回归任务中 CP 区间的“紧密度”。具体而言，对于绝对残差和基于分位数的非一致性评分，我们证明了：1) 对称调整的区间长度上限增加 $2|b|$，其中 $b$ 是一个全局应用的标量值，代表偏差，2) 非对称调整的区间长度不受偏差影响，以及 3) 非对称调整的区间长度保证小于对称调整的区间长度的条件。我们的分析表明，即使预测结果与真实值存在显著偏差，非对称调整的区间仍然能够保持与没有偏差时的相同紧密度和有效性，而对称调整的区间长度会显著膨胀。我们通过两个现实世界的预测任务来证明我们的理论结果：稀疏视图计算机断层扫描 (CT) 重建和时间序列天气预报。我们的工作为构建更具偏差鲁棒性的机器学习系统铺平了道路。