摘要
arXiv:2505.04608v2 宣布类型: replace-cross
摘要: 在高风险环境中负责任地部署人工智能(AI)/机器学习(ML)系统不仅需要证明系统的可靠性,还需要在部署后进行持续监测,以快速检测和解决任何不安全的行为。非参数变化点检测的统计方法——尤其是遵从测试鞅(CTMs)和随时有效的推论工具——提供了这种监测任务的有前景的方法。然而,现有方法仅限于监控有限的假设类别或“警报标准”(如违反某些可交换性假设的数据转移),无法在响应转移时进行在线适应,或者无法进行任何性能下降的根本原因分析。在本文中,我们通过提出加权的遵从测试鞅的一般化(WCTMs)来扩展这些监控方法的应用范围,为数据分布中的任何意外变化点进行在线监测,同时控制错误警报。在实际应用中,我们提出了特定的WCTM算法,这些算法可以在轻微协变量转移(边缘输入分布)的情况下进行在线适应,同时快速检测和诊断更严重的转移,如概念转移(条件标签分布)或无法轻易适应的极端(超出支持范围)协变量转移。在实际数据集上,我们展示了相对于现有最佳基准的性能改进。