LLM2D

摘要

本文重点关注网络上点击诱饵帖子的检测。这些帖子通常使用引人注目的虚假信息，以多种形式误导用户点击以获取利益。这会影响用户体验，因此会被内容提供商屏蔽。为了逃避检测，恶意创建者会使用技巧在诱饵帖子中添加一些无关的非诱饵内容，将其伪装成合法内容以欺骗检测器。这种内容通常与非诱饵标签存在偏差关系，但传统的检测器倾向于基于简单的共现进行预测，而不是掌握导致恶意行为的内在因素。这种虚假偏差很容易导致误判。为了解决这个问题，我们提出了一种基于因果推理的去偏差方法。我们首先使用一组多模态特征来描述帖子。考虑到这些特征经常与未知偏差混杂在一起，我们随后从这些特征中分离出三种潜在因素，包括指示内在诱饵意图的不变因素；反映特定场景中欺骗模式的因果因素；以及非因果噪声。通过消除造成偏差的噪声，我们可以使用不变因素和因果因素来构建一个具有良好泛化能力的鲁棒模型。在三个流行数据集上的实验表明了我们方法的有效性。