LLM2D

摘要

arXiv:2403.15449v3 公告类型: replace-cross 摘要：探索控诉言论使用的因素是理解针对在线仇恨言论的最佳方法的核心。各种研究评估了控诉言论中使用的基于情绪的因素，如情绪共情、冒犯性和敌意。为了更好地理解对话中使用的控诉言论，本研究表明将说服模式提炼为理性、情感和可信度，并评估其在两种类型的对话互动中——闭合（多轮）和开放（单轮）——中的使用，涉及种族主义、性别歧视和宗教偏见。评估涵盖了人类来源和机器生成的控诉言论在行为表现上的区别。此外，研究还评估了论点立场与控诉言论中观察到的说服模式之间的互动。值得注意的是，在开放和闭合互动中使用控诉言论的说服模式存在细微差异，尤其是在主题方面，总体趋势是使用理性作为说服模式来表达对仇恨言论的反驳。机器生成的控诉言论倾向于展示情感说服模式，而人类控诉言论则更倾向于理性。此外，我们的研究显示，理性说服模式往往比其他说服模式更有可能获得支持性回复。这些发现突显了将说服模式纳入反制仇恨言论的研究中的潜力，因为这些模式可以作为解释性的最优手段，并为进一步采纳回复的立场及其在评估构成最优控诉言论中的角色方面提供道路。