LLM2D
罕见事件预测综述
A Comprehensive Survey on Rare Event Prediction
作者: Chathurangi Shyalika, Ruwan Wickramarachchi, Amit Sheth
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2309.11356v2

摘要

罕见事件预测涉及使用机器学习 (ML) 和数据分析来识别和预测低概率事件。由于数据分布不均衡,常见事件的频率远远超过罕见事件,因此需要在 ML 管道的每个步骤中使用专门的方法,例如从数据处理到算法再到评估协议。预测罕见事件的发生对于现实世界中的应用(例如工业 4.0)非常重要,并且是统计学和 ML 中的一个活跃研究领域。本文全面回顾了罕见事件预测的当前方法,涵盖了四个方面:罕见事件数据、数据处理、算法方法和评估方法。具体来说,我们考虑了来自不同模态(即数值、图像、文本和音频)的 73 个数据集,四类主要的数据处理类别,五类主要算法分组和两种更广泛的评估方法。本文旨在识别当前文献中的差距,并强调预测罕见事件的挑战。它还提出了潜在的研究方向,可以帮助指导从业者和研究人员。