LLM2D
处理仇恨言论分类中的注释者分歧
Dealing with Annotator Disagreement in Hate Speech Classification
作者: Somaiyeh Dehghan, Mehmet Umut Sen, Berrin Yanikoglu
发布日期: 2/13/2025
arXiv ID: oai:arXiv.org:2502.08266v1

摘要

arXiv:2502.08266v1 声明类型: cross 摘要:仇恨言论检测是一个关键任务,特别是在社交媒体上,有害内容可以迅速传播。实施机器学习模型以自动识别和应对仇恨言论对于减轻其影响和防止其传播至关重要。开发有效的仇恨言论检测模型的第一步是获取高质量的数据集进行训练。标记数据是大多数自然语言处理任务的基础,但由于仇恨言论多样且往往具有主观性,导致分类仇恨言论具有挑战性,这可能会导致标注者之间的不同解释和分歧。本文探讨了应对标注者分歧的策略,这是一个长期以来被忽视的问题。特别是,我们基于微调的 BERT 模型评估了处理土耳其推文中的仇恨言论分类标注者分歧的不同方法。我们的研究突显了该问题的重要性,并提供了关于在线讨论中仇恨言论检测和理解的最先进的基准结果。