LLM2D

摘要

arXiv:2503.23605v1 宣布类型：交叉摘要：在人工智能中，一个基本任务是为在未见领域做出的预测提供性能保证。实际上，新数据的分布可能会有很大不确定性，现有预测器的性能也会相应地变化。本论文基于部分识别和可传输性的理论，引入了在给定量源自域的数据和数据生成机制假设（编码在因果图中）的情况下，对目标分布的函数（如分类器的泛化误差）上限的新结果。我们的贡献是提供了第一个适用于传输问题的一般估计技术，通过适应现有参数化方案（如神经因果模型）来编码跨人群推理所需的结构约束。我们展示了该过程的表达能力和一致性，并进一步提出了一种基于梯度的优化方案，以在实践中进行可扩展的推导。我们的结果得到了实验的验证。