LLM2D

摘要

arXiv:2409.13557v1 公告类型: 交叉摘要: 社交媒体平台上仇恨言论的激增构成了重大挑战，仇恨言论检测（HSD）变得日益重要。当前的HSD方法侧重于丰富上下文信息以提高检测性能，但忽略了仇恨言论的内在不确定性。我们提出了一种新的HSD方法，名为通过视觉增强的可信仇恨言论检测方法（TrusV-HSD），该方法通过与扩散视觉图像的整合来增强语义信息，并通过可信损失来缓解不确定性。TrusV-HSD通过多模态连接有效提取可信信息，无需配对数据即可学习语义表示。我们在公开的HSD数据集上的实验证明了TrusV-HSD的有效性，显示出显著优于传统方法的改进。