LLM2D

摘要

arXiv:2504.10112v1 宣传类型：交叉摘要：大规模语言模型（LLMs）已成为推动具有攻击性的渗透测试工具的强大方法。本文分析了用于评估大规模语言模型（LLM）驱动攻击的方法学和基准测试实践，重点关注LLM在网络安全中的进攻性使用。我们回顾了16篇研究论文，其中详细介绍了15种原型及其各自的测试平台。我们阐述了我们的发现，并提供了对未来研究的实际建议，强调扩展现有测试平台、建立基线、包括全面的度量标准和定性分析的重要性。我们还指出，安全研究与实践之间的区别，建议基于CTF的挑战可能无法完全代表现实世界的渗透测试场景。