LLM2D

摘要

arXiv:2504.13231v1 类型: cross 摘要：在野火事件中，快速获取信息至关重要，但传统数据源速度慢且成本高。社交媒体可以提供实时更新，但提取相关的见解仍然是一项挑战。我们介绍了WildFireCan-MMD，这是一个新的多模态数据集，包含最近加拿大野火事件中的X个帖子，并在13个关键主题上进行了标注。通过评估Vision Language模型和定制训练的分类器，我们显示，在零样本提示可以快速部署的情况下，即使是最简单的训练模型在有标注数据时的表现也要高出23%。我们的研究结果强调了定制数据集和任务特定训练的持久重要性。重要的是，这样的数据集应该本地化，因为灾害响应需求在地区和背景下会有所不同。