摘要
arXiv:2504.19066v1 类别: cross
摘要:准确评估极端天气事件对于研究和政策制定至关重要,但在世界许多地区,局部和细粒度的数据依然稀缺。这一数据缺口限制了我们分析极端天气事件潜在结果和影响的能力,妨碍了有效的决策。大型语言模型(LLMs)可以处理大量的非结构化文本数据,提取有意义的见解,并生成综合多源信息的详细评估。此外,LLMs 可以无缝地将他们的通用语言理解转移到较小的模型中,使这些模型保留关键知识并在特定任务上进行微调。在本文中,我们提出了一种名为极端天气推理感知对齐(EWRA)的方法,该方法通过将从 LLMs 中推导出的结构化推理路径引入小型语言模型(SLMs)来增强小型语言模型,以及一个包含极端天气事件相关新闻文章的巨大数据集 ExtremeWeatherNews。EWRA 和 ExtremeWeatherNews 一起形成了专注于解决三个关键极端天气任务的整体框架 ClimaEmpact:物理脆弱性/影响分类、主题标签和情绪分析。通过在 ExtremeWeatherNews(及其为 SLM 对齐专门使用的衍生数据集 ExtremeAlign)上对 SLMs 进行高级推理策略的对齐,EWRA 提高了 SLMs 生成符合实际和领域特定响应的能力,以进行极端天气分析。我们的结果显示,提出的这种方法指导 SLMs 产生符合领域的响应,其性能超过了专门任务模型,并为极端天气分析提供了增强的实际应用性。