LLM2D

摘要

arXiv:2504.21045v1 安全公告类型：交叉摘要：根据开放网络应用安全项目（OWASP）的报告，跨站脚本（XSS）是一种关键的安全漏洞。尽管经过了几十年的研究，XSS 仍然位居前十大安全漏洞之列。研究人员提出了各种技术来保护系统免受 XSS 攻击，其中机器学习（ML）是最常用的方法之一。一个 ML 模型被训练在一个数据集上，以识别潜在的 XSS 威胁，其有效性高度依赖于训练数据的规模和多样性。XSS 的一种变体是被混淆的 XSS，攻击者会使用混淆技术改变代码结构，使得安全系统难以检测其恶意意图。我们的研究中的随机森林模型在传统（非混淆）XSS 数据上实现了 99.8% 的准确率。然而，在测试混淆 XSS 样本时，准确率下降到 81.9%，这突显了使用混淆数据训练 ML 模型以提高检测 XSS 攻击效果的重要性。一个主要的挑战是如何生成高度复杂的混淆代码，尽管已有多个公开的工具可用，这些工具仅能生产一定程度复杂的混淆代码。在我们提出的系统中，我们对大型语言模型（LLM）进行微调，以自动生成复杂的混淆 XSS 载荷。通过将原始 XSS 样本转换为多种多样且复杂的混淆变体，我们为 ML 模型评估生成了具有挑战性的训练数据。我们的方法在混淆数据集上实现了 99.5% 的准确率。我们还发现，由 LLM 生成的混淆样本比其他工具生成的样本复杂 28.1%，这显著提高了模型处理高级 XSS 攻击的能力，使其更适合应用于实际场景中的安全防护。