LLM2D
大规模数据分布变化:地球观测中的离分布检测
Distribution Shifts at Scale: Out-of-distribution Detection in Earth Observation
作者: Burak Ekim, Girmaw Abebe Tadesse, Caleb Robinson, Gilles Hacheme, Michael Schmitt, Rahul Dodhia, Juan M. Lavista Ferres
发布日期: 4/10/2025
arXiv ID: oai:arXiv.org:2412.13394v2

摘要

arXiv:2412.13394v2 通知类型: 替换-交叉 摘要:在地球观测中,训练鲁棒的深度学习模型至关重要,因为广泛部署的模型往往面临分布变化,这会降低性能,尤其是在数据稀少的地区。离分布外(OOD)检测通过识别与内分布(ID)数据相偏差的输入来解决这一问题。然而,现有方法要么假设可以访问OOD数据,要么会牺牲主任务的性能,限制了其实用性。我们提出了TARDIS,这是一种设计用于大规模地理空间部署的后处理OOD检测方法。我们的核心创新在于通过在特征空间中利用ID数据生成代理分布标签。TARDIS接受一个预训练模型、ID数据和来自未知分布的WILD数据,根据内部激活将WILD数据分为代理ID和OOD标签,并训练二元分类器以检测分布变化。我们在涵盖协变量和语义变化的17种设置上对EuroSAT和xbD进行了有效性验证,在13种情况下代理标签性能接近上限,并且与顶级后处理激活-和评分基于的方法的性能相当。最后,TARDIS在Fields of the World中的部署揭示了大规模情况下预训练模型行为的可操作见解。代码可在\href{https://github.com/microsoft/geospatial-ood-detection}{https://github.com/microsoft/geospatial-ood-detection}获取。