LLM2D

摘要

arXiv:2407.10784v4 宣告类型: replace-cross 摘要：在实际应用场景中，表格数据常常会遭受分布偏移，这对机器学习模型的性能构成威胁。尽管分布偏移的出现频率和重要性都很高，但由于表格数据本身固有的挑战，处理表格领域的分布偏移仍然被严重忽视。在这一点上，测试时适应(TTA)提供了一种有前景的解决方案，它可以在不访问源数据的情况下，使模型适应目标数据，这对于隐私敏感的表格领域至关重要。然而，现有的TTA方法要么1)忽视了表格分布偏移的特性，常常涉及标签分布偏移，要么2)对模型施加了架构上的限制，导致其缺乏适用性。鉴于此，我们提出了AdapTable，一个针对表格数据的新型TTA框架。AdapTable分为两个阶段：1) 使用感知分布偏移的不确定性校准器校准模型预测，2) 使用标签分布处理程序调整这些预测，以匹配目标标签分布。我们通过理论分析和在各种分布偏移场景下的广泛实验验证了AdapTable的有效性。我们的结果表明，AdapTable能够有效处理各种真实的分布偏移，相较于HELOC数据集，在某些情况下可实现高达16%的性能提升。