LLM2D

摘要

arXiv:2505.04608v2 宣布类型: replace-cross 摘要: 在高风险环境中负责任地部署人工智能（AI）/机器学习（ML）系统不仅需要证明系统的可靠性，还需要在部署后进行持续监测，以快速检测和解决任何不安全的行为。非参数变化点检测的统计方法——尤其是遵从测试鞅（CTMs）和随时有效的推论工具——提供了这种监测任务的有前景的方法。然而，现有方法仅限于监控有限的假设类别或“警报标准”（如违反某些可交换性假设的数据转移），无法在响应转移时进行在线适应，或者无法进行任何性能下降的根本原因分析。在本文中，我们通过提出加权的遵从测试鞅的一般化（WCTMs）来扩展这些监控方法的应用范围，为数据分布中的任何意外变化点进行在线监测，同时控制错误警报。在实际应用中，我们提出了特定的WCTM算法，这些算法可以在轻微协变量转移（边缘输入分布）的情况下进行在线适应，同时快速检测和诊断更严重的转移，如概念转移（条件标签分布）或无法轻易适应的极端（超出支持范围）协变量转移。在实际数据集上，我们展示了相对于现有最佳基准的性能改进。