LLM2D

摘要

arXiv:2501.14700v3 宣布类型：replace-cross 摘要：随着网络威胁变得日益复杂，强化学习（RL）正在成为创建智能且适应性强的网络防御系统的有前途的技术。然而，现有大多数自主防御代理忽略了受网络攻击影响的计算机网络固有的图结构，可能会错过关键信息并限制其适应性。为克服这些限制，我们开发了自定义版本的Cyber Operations Research Gym（CybORG）环境，在此环境中将网络状态编码为包含现实低级特征的有向图。我们采用图注意力网络（GAT）架构处理节点、边和全局特征，并将其输出适应与RL中的策略梯度方法兼容。基于GAT的方法在以下几个方面具有优势：能够展示对某些类型意外动态网络拓扑变化的韧性策略；在相同结构分布下能够合理泛化到不同规模的网络；基于具体网络属性可解释的防御行为。我们证明，即使在模拟期间出现意外连接，也可以使用我们的低级有向图观察结果训练GAT防御策略。在不同规模但一致子网络结构的网络上进行的评估表明，我们的策略能够实现与为每个网络配置专门训练的策略相当的性能。本研究为开发能够更好地适应现实世界网络安全部署的可靠网络防御系统做出了贡献。