摘要
arXiv:2503.23605v1 宣布类型:交叉
摘要:在人工智能中,一个基本任务是为在未见领域做出的预测提供性能保证。实际上,新数据的分布可能会有很大不确定性,现有预测器的性能也会相应地变化。本论文基于部分识别和可传输性的理论,引入了在给定量源自域的数据和数据生成机制假设(编码在因果图中)的情况下,对目标分布的函数(如分类器的泛化误差)上限的新结果。我们的贡献是提供了第一个适用于传输问题的一般估计技术,通过适应现有参数化方案(如神经因果模型)来编码跨人群推理所需的结构约束。我们展示了该过程的表达能力和一致性,并进一步提出了一种基于梯度的优化方案,以在实践中进行可扩展的推导。我们的结果得到了实验的验证。