LLM2D

摘要

我们提出了一种利用自然语言处理（NLP）技术预测乌克兰-俄罗斯和哈马斯-以色列冲突这两起近期事件的毒性和其他文本属性的方法。本文为未来冲突的探索提供了基础，希望通过在冲突开始之前和之后分析社交媒体来降低风险。我们的工作从 Twitter 和 Reddit 收集了多个数据集，分别用于冲突发生前后的分离，目的是预测未来社交媒体的状态以避免冲突。更具体地说，我们证明了：（1）在冲突发生前后的社交媒体讨论中存在明显的差异，以及（2） Twitter 和 Reddit 等平台上的社交媒体话语有助于识别未来冲突的发生。我们的结果表明，通过使用先进的 NLP 技术（监督和无监督），冲突前后的语言毒性和其他属性是可以预测的，两种冲突的误差率都接近 1.2%。