LLM2D
WildFireCan-MMD:一个用于加拿大野火期间用户生成内容分类的多模态数据集
WildFireCan-MMD: A Multimodal dataset for Classification of User-generated Content During Wildfires in Canada
作者: Braeden Sherritt, Isar Nejadgholi, Marzieh Amini
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2504.13231v1

摘要

arXiv:2504.13231v1 类型: cross 摘要:在野火事件中,快速获取信息至关重要,但传统数据源速度慢且成本高。社交媒体可以提供实时更新,但提取相关的见解仍然是一项挑战。我们介绍了WildFireCan-MMD,这是一个新的多模态数据集,包含最近加拿大野火事件中的X个帖子,并在13个关键主题上进行了标注。通过评估Vision Language模型和定制训练的分类器,我们显示,在零样本提示可以快速部署的情况下,即使是最简单的训练模型在有标注数据时的表现也要高出23%。我们的研究结果强调了定制数据集和任务特定训练的持久重要性。重要的是,这样的数据集应该本地化,因为灾害响应需求在地区和背景下会有所不同。