LLM2D

摘要

arXiv:2505.07089v1 宣布类型: 新摘要: 由大型语言模型（LLMs）驱动的自动化渗透测试（AutoPT）因其能够自动化伦理黑客攻击过程并在目标系统中识别漏洞而引起了关注。然而，现有的基于LLM的AutoPT框架在面对挑战性任务时往往不如人类专家表现良好，原因包括LLM训练中不均衡的知识、规划过程中的短视规划以及命令生成过程中的幻觉。此外，渗透测试（PT）过程因其试错性质，现有的框架缺乏机制来利用之前失败操作的经验，从而限制了PT策略的适应性改进。为了应对这些局限性，我们提出了一种由LLM支持的知识驱动和自我反思的渗透测试框架，称为RefPentester，这是一项旨在协助人类操作员识别当前PT过程阶段、选择合适的战术和技术、选择建议的操作、提供逐步操作指导，并从之前的失败操作中学习的AutoPT框架。我们还将PT过程建模为一个包含七个状态的阶段机器，以有效集成提出的框架。评估结果显示，RefPentester在揭示Hack The Box的Sau机器上的凭据方面表现成功，优于基准的GPT-4o模型16.7%。在PT的各个阶段，RefPentester还显示了在PT阶段转换上的优越成功率。