LLM2D
通过视觉增强实现可信的仇恨言论检测
Trustworthy Hate Speech Detection Through Visual Augmentation
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13557v1

摘要

arXiv:2409.13557v1 公告类型: 交叉 摘要: 社交媒体平台上仇恨言论的激增构成了重大挑战,仇恨言论检测(HSD)变得日益重要。当前的HSD方法侧重于丰富上下文信息以提高检测性能,但忽略了仇恨言论的内在不确定性。我们提出了一种新的HSD方法,名为通过视觉增强的可信仇恨言论检测方法(TrusV-HSD),该方法通过与扩散视觉图像的整合来增强语义信息,并通过可信损失来缓解不确定性。TrusV-HSD通过多模态连接有效提取可信信息,无需配对数据即可学习语义表示。我们在公开的HSD数据集上的实验证明了TrusV-HSD的有效性,显示出显著优于传统方法的改进。