LLM2D

摘要

arXiv:2505.04608v1 宣布类型: 横跨领域摘要: 在高风险环境下负责任地部署人工智能（AI）/机器学习（ML）系统，不仅需要证明系统的可靠性，还需要持续的、部署后的监控，以便快速检测和处理任何不安全的行为。非参数变化点检测的统计方法，尤其是同变检验鞅（CTMs）和随时有效的推断工具，为这一监测任务提供了有前景的途径。然而，现有的方法仅适用于监测有限的假设类别或“警报标准”，例如违反某些可交换性假设的数据变化，或者不能在线适应响应变化。在本文中，我们通过提出加权的同变检验鞅的一般化（WCTMs）来扩展这些监控方法的范围，这为控制假警报的同时进行任何未预期的变化点监测建立了理论基础。对于实际应用，我们提出了具体的WCTM算法，这些算法可以适应对边缘输入分布的小幅度协变量变化，并对更严重的变换，如概念变换（在条件标签分布中）或超出支持范围的极端协变量变换（难以适应的情况），发出警报。在实际数据集上，我们展示了相对于最先进的基准方法的改进性能。