摘要
arXiv:2504.10112v1 宣传类型:交叉
摘要:大规模语言模型(LLMs)已成为推动具有攻击性的渗透测试工具的强大方法。本文分析了用于评估大规模语言模型(LLM)驱动攻击的方法学和基准测试实践,重点关注LLM在网络安全中的进攻性使用。我们回顾了16篇研究论文,其中详细介绍了15种原型及其各自的测试平台。我们阐述了我们的发现,并提供了对未来研究的实际建议,强调扩展现有测试平台、建立基线、包括全面的度量标准和定性分析的重要性。我们还指出,安全研究与实践之间的区别,建议基于CTF的挑战可能无法完全代表现实世界的渗透测试场景。