LLM2D
用于无监督分布漂移检测的自组织聚类系统
A Self-Organizing Clustering System for Unsupervised Distribution Shift Detection
作者: Sebasti\'an Basterrech, Line Clemmensen, Gerardo Rubino
发布日期: 10/23/2024
arXiv ID: oai:arXiv.org:2404.16656v2

摘要

对非平稳数据的建模是持续学习领域中的一项挑战,数据分布的偏移可能会对机器学习模型的性能产生负面影响。传统的学习工具通常容易受到输入协变量扰动的影响,并且对异常值和噪声敏感,一些工具还基于严格的代数假设。由于生产原材料的变化、季节性、用户群的不同甚至对抗性攻击,数据分布偏移经常发生。因此,需要更有效的分布偏移检测技术。在这项工作中,我们提出了一种持续学习框架来监控和检测分布变化。我们在由生物启发的自组织聚类和潜在空间的统计方面生成的潜在空间中探索这个问题。特别地,我们研究了由两个拓扑保持映射进行的投影:自组织映射和尺度不变映射。我们的方法可以在监督和无监督的环境中应用。我们将数据分布变化的评估构建为高斯信号的比较,使所提出的方法快速且鲁棒。我们将它与其他无监督技术进行比较,特别是主成分分析 (PCA) 和核 PCA。我们的比较包括使用图像序列(基于 MNIST 和注入对抗性样本的偏移)、化学传感器测量值和与臭氧水平相关的环境变量进行实验。实证研究揭示了所提出方法的潜力。