LLM2D
利用大语言模型强化基于机器学习的跨站脚本检测
Leveraging LLM to Strengthen ML-Based Cross-Site Scripting Detection
作者: Dennis Miczek, Divyesh Gabbireddy, Suman Saha
发布日期: 5/1/2025
arXiv ID: oai:arXiv.org:2504.21045v1

摘要

arXiv:2504.21045v1 安全公告类型:交叉 摘要:根据开放网络应用安全项目(OWASP)的报告,跨站脚本(XSS)是一种关键的安全漏洞。尽管经过了几十年的研究,XSS 仍然位居前十大安全漏洞之列。研究人员提出了各种技术来保护系统免受 XSS 攻击,其中机器学习(ML)是最常用的方法之一。一个 ML 模型被训练在一个数据集上,以识别潜在的 XSS 威胁,其有效性高度依赖于训练数据的规模和多样性。XSS 的一种变体是被混淆的 XSS,攻击者会使用混淆技术改变代码结构,使得安全系统难以检测其恶意意图。我们的研究中的随机森林模型在传统(非混淆)XSS 数据上实现了 99.8% 的准确率。然而,在测试混淆 XSS 样本时,准确率下降到 81.9%,这突显了使用混淆数据训练 ML 模型以提高检测 XSS 攻击效果的重要性。一个主要的挑战是如何生成高度复杂的混淆代码,尽管已有多个公开的工具可用,这些工具仅能生产一定程度复杂的混淆代码。 在我们提出的系统中,我们对大型语言模型(LLM)进行微调,以自动生成复杂的混淆 XSS 载荷。通过将原始 XSS 样本转换为多种多样且复杂的混淆变体,我们为 ML 模型评估生成了具有挑战性的训练数据。我们的方法在混淆数据集上实现了 99.5% 的准确率。我们还发现,由 LLM 生成的混淆样本比其他工具生成的样本复杂 28.1%,这显著提高了模型处理高级 XSS 攻击的能力,使其更适合应用于实际场景中的安全防护。