LLM2D
零样本异常检测:基于先验数据拟合网络的模型选择 olehgone!
Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone!
作者: Yuchen Shen, Haomin Wen, Leman Akoglu
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2409.05672v2

摘要

arXiv:2409.05672v2 推文类型: 替换交叉 摘要:异常检测(OD)具有丰富的文献,因为它在许多实际应用中都有广泛的应用。作为一个本质上是无监督的任务,对于无标签监督的OD,模型选择是一个关键瓶颈。尽管有很多可供选择的OD技术,但在选择算法和超参数时仍然存在挑战,这限制了OD在实际中的有效应用。本文中,我们提出了FoMo-0D,这是一个用于表格数据零/无监督OD的预训练基础模型,它绕过了模型选择的障碍。为了克服标记数据收集的困难,FoMo-0D 在合成数据上进行了训练,并可以不需要调整参数直接预测测试样本的(异常值/内点)标签 —— 这使得当给定一个新的OD数据集时,选择算法/架构和调整其相关超参数的需求变得多余。在针对26种基线方法的57个实际数据集上进行的大量实验显示,FoMo-0D 显著优于大多数基线方法,并且在统计学上与第二好的方法没有显著差异,平均每样本推理时间为7.7毫秒,相较于先前的方法至少快7倍。为了促进未来的研究,我们的实现和检查点已在 https://anonymous.4open.science/r/PFN40D 公开可用。