LLM2D

摘要

arXiv:2502.05225v1 通知类型: 交叉摘要: 网络欺诈常通过视觉被扰动的文本来针对受害者，以绕过安全系统。这些文本中的噪声充当了对抗性攻击，旨在欺骗语言模型并阻碍它们准确解析内容的能力。然而，由于获取足够的网络欺诈案例困难，先前的研究使用不包含真实案例的合成数据集。在这项研究中，我们提出了一个名为BitAbuse的数据集，该数据集包含真实世界的网络欺诈案例，以解决先前研究的局限性。该数据集包含总共325,580个视觉被扰动的文本。数据集的输入来源于原始语料库，其中包括视觉被扰动的句子和通过人工扰动过程生成的句子。每个输入句子都标注了相应的_ground truth_，表示恢复后的非扰动版本。使用我们提出的数据集训练的语言模型在性能上明显优于先前的方法，准确率达到约96%。我们的分析揭示了真实世界案例和合成案例之间存在显著差距，突显了我们数据集对于构建可靠的预训练模型用于恢复任务的价值。我们发布了包含视觉被扰动的真实世界网络欺诈案例的BitAbuse数据集，以支持未来对抗性攻击防御的研究。