摘要
arXiv:2505.08529v1 Announce Type: cross
摘要:我们的星球正面临越来越频繁的极端事件,这些事件对人类生活和生态系统构成了重大风险。近年来,特别是在大规模数据集上训练的预训练模型(FMs)方面的机器学习(ML)进步,在提取特征方面表现出色,并有望在灾害管理中发挥作用。然而,这些模型往往继承了训练数据中的偏见,这对其在极端情况下的性能构成挑战。为了探讨预训练模型在极端事件背景下的可靠性,我们引入了ExEBench(极端地球基准),涵盖七类极端事件类别,包括洪水、野火、风暴、热带气旋、极端降水、热浪和寒潮。该数据集具有全球覆盖范围、不同的数据量以及多样化的数据来源,这些数据来源具有不同的空间、时间和光谱特征。为了扩大预训练模型在现实世界中的影响,我们包含了多个与极端事件检测、监控和预报密切相关的具有挑战性的机器学习任务。ExEBench旨在(1)评估预训练模型在多种高冲击任务和领域的可推广性,(2)促进有利于灾害管理的新型机器学习方法的发展,并(3)提供一个平台,用于分析极端事件之间的相互作用和级联效应,以增进我们对地球系统,特别是在未来几十年预期气候变暖情况下的理解。该数据集和代码已公开,可在https://github.com/zhaoshan2/EarthExtreme-Bench获取。