LLM2D
基于对比表征学习的极度不平衡多元时间序列数据太阳耀斑预测
Contrastive Representation Learning for Predicting Solar Flares from Extremely Imbalanced Multivariate Time Series Data
作者: Onur Vural, Shah Muhammad Hamdi, Soukaina Filali Boubrahimi
发布日期: 10/2/2024
arXiv ID: oai:arXiv.org:2410.00312v1

摘要

大型太阳耀斑是太阳磁通量的突然激增,对技术基础设施构成重大风险。鉴于此,利用机器学习方法从太阳活动区磁场数据中有效预测重大耀斑在空间天气研究中变得至关重要。磁场数据可以用多元时间序列模态表示,由于重大耀斑事件的罕见性,数据显示出极端类别不平衡。在基于时间序列分类的耀斑预测中,对比表示学习方法的使用相对有限。在本文中,我们介绍了 CONTREX,一种针对多元时间序列数据的新型对比表示学习方法,解决了时间依赖性和极端类别不平衡的挑战。我们的方法包括从多元时间序列实例中提取动态特征,从正负类特征向量中推导出两个极端,它们提供了最大的分离能力,并使用我们新颖的对比重建损失,在原始多元时间序列数据引导下训练一个序列表示嵌入模块,以生成与极值点对齐的嵌入。这些嵌入捕获了基本的时间序列特征,并增强了判别能力。我们的方法在针对基线方法的空间天气分析太阳耀斑(SWAN-SF)多元时间序列基准数据集上显示出有希望的太阳耀斑预测结果。