LLM2D

摘要

arXiv:2505.07089v2 宣告类型: 替换摘要：由大型语言模型（LLMs）驱动的自动化渗透测试（AutoPT）因其能够利用LLMs固有的知识自动执行伦理黑客流程并识别目标系统的漏洞而引起关注。然而，现有的基于LLM的AutoPT框架在挑战性任务中的表现通常不及人类专家，原因包括LLM训练中知识的不平衡、计划过程中的短视规划以及命令生成过程中的幻觉。此外，渗透测试（PT）过程因其试错性质而受到现有框架的限制，这些框架缺乏从过往失败操作中学习的机制，限制了PT策略的适应性改进。为了解决这些限制，我们提出了一种由LLM驱动的知识驱动自我反思型渗透测试框架，称为RefPentester，这是一种旨在协助人类操作员识别当前PT过程阶段、选择合适战术和技巧、选择建议操作、提供分步操作指南，并从过往失败操作中学习的AutoPT框架。我们还将PT过程建模为一个七状态阶段机，以有效地集成所提出框架。评估结果显示，RefPentester能在Hack The Box的Sau机器上成功揭示凭证，比基线GPT-4o模型高出16.7%的成功率。在整个PT阶段中，RefPentester还在PT阶段过渡方面展示了更高的成功率。