摘要
arXiv:2407.10784v4 宣告类型: replace-cross
摘要:在实际应用场景中,表格数据常常会遭受分布偏移,这对机器学习模型的性能构成威胁。尽管分布偏移的出现频率和重要性都很高,但由于表格数据本身固有的挑战,处理表格领域的分布偏移仍然被严重忽视。在这一点上,测试时适应(TTA)提供了一种有前景的解决方案,它可以在不访问源数据的情况下,使模型适应目标数据,这对于隐私敏感的表格领域至关重要。然而,现有的TTA方法要么1)忽视了表格分布偏移的特性,常常涉及标签分布偏移,要么2)对模型施加了架构上的限制,导致其缺乏适用性。鉴于此,我们提出了AdapTable,一个针对表格数据的新型TTA框架。AdapTable分为两个阶段:1) 使用感知分布偏移的不确定性校准器校准模型预测,2) 使用标签分布处理程序调整这些预测,以匹配目标标签分布。我们通过理论分析和在各种分布偏移场景下的广泛实验验证了AdapTable的有效性。我们的结果表明,AdapTable能够有效处理各种真实的分布偏移,相较于HELOC数据集,在某些情况下可实现高达16%的性能提升。