摘要
arXiv:2504.13231v1 类型: cross
摘要:在野火事件中,快速获取信息至关重要,但传统数据源速度慢且成本高。社交媒体可以提供实时更新,但提取相关的见解仍然是一项挑战。我们介绍了WildFireCan-MMD,这是一个新的多模态数据集,包含最近加拿大野火事件中的X个帖子,并在13个关键主题上进行了标注。通过评估Vision Language模型和定制训练的分类器,我们显示,在零样本提示可以快速部署的情况下,即使是最简单的训练模型在有标注数据时的表现也要高出23%。我们的研究结果强调了定制数据集和任务特定训练的持久重要性。重要的是,这样的数据集应该本地化,因为灾害响应需求在地区和背景下会有所不同。