摘要
我们提出了一种利用自然语言处理(NLP)技术预测乌克兰-俄罗斯和哈马斯-以色列冲突这两起近期事件的毒性和其他文本属性的方法。本文为未来冲突的探索提供了基础,希望通过在冲突开始之前和之后分析社交媒体来降低风险。我们的工作从 Twitter 和 Reddit 收集了多个数据集,分别用于冲突发生前后的分离,目的是预测未来社交媒体的状态以避免冲突。更具体地说,我们证明了:(1)在冲突发生前后的社交媒体讨论中存在明显的差异,以及(2) Twitter 和 Reddit 等平台上的社交媒体话语有助于识别未来冲突的发生。我们的结果表明,通过使用先进的 NLP 技术(监督和无监督),冲突前后的语言毒性和其他属性是可以预测的,两种冲突的误差率都接近 1.2%。