摘要
arXiv:2502.13030v1 Announce Type: cross
摘要:我们考虑在协变量偏移环境下进行同分布预言的问题。给定源领域有标签的数据和目标领域协变量偏移的无标签数据,我们寻求在目标领域构建具有有效边际覆盖率的预言集合。现有的大多数方法需要估计未知的似然比函数,这在处理高维数据如图像时可能会带来挑战。为解决这一问题,我们引进了似然比正则化分位数回归(LR-QR)算法,通过结合尖球损失和一种新的正则化选择,来构建一个阈值函数,而不直接估计未知的似然比函数。我们证明,在目标领域,LR-QR方法能达到所需的覆盖率,只产生一个小的可控制的误差项。我们的证明依赖于学习理论中一种新颖的覆盖率通过稳定性界分析。我们的实验表明,在高维预测任务中,包括Communities and Crime数据集的回归任务和来自WILDS仓库的图像分类任务中,LR-QR算法优于现有方法。