LLM2D
非平稳环境下学习的稳定性原理
A Stability Principle for Learning under Non-Stationarity
作者: Chengpiao Huang, Kaizheng Wang
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2310.18304v3

摘要

我们开发了一个用于非平稳环境下统计学习的通用框架。在每个时间段内,我们的方法应用稳定性原则来选择一个回溯窗口,该窗口最大限度地利用历史数据,同时将累积偏差保持在相对于随机误差的可接受范围内。我们的理论和数值实验展示了这种方法对未知非平稳性的适应性。我们证明了当总体损失是强凸的或仅是Lipschitz连续时,遗憾界是最小最大意义下最优的,最多相差对数因子。我们分析的核心在于两个新颖的组成部分:函数相似性度量和将非平稳数据序列分割成准平稳片段的分割技术。