摘要
现代网络防御可以从使用自主系统中获益,将繁琐且耗时的工作卸载到具有标准和学习功能组件的代理上。这些代理在关键网络基础设施上运行,需要具备鲁棒性和可信赖性,以确保防御适应性强的网络攻击者,同时为其行动和网络活动提供解释。然而,学习功能组件通常使用模型(例如深度神经网络),这些模型在其高级决策中并不透明,从而导致保证方面的挑战。此外,网络防御代理必须以反应式的方式执行复杂的长期防御任务,这涉及协调多个相互依赖的子任务。行为树以其在建模可解释、反应式和模块化代理策略(具有学习功能组件)方面的成功而闻名。在本文中,我们开发了一种使用具有学习功能组件的行为树设计自主网络防御代理的方法,我们将其称为进化行为树 (EBT)。我们使用新颖的抽象网络环境学习 EBT 的结构,并优化学习功能组件以进行部署。学习功能组件经过优化,能够适应各种网络攻击并部署安全机制。学习到的 EBT 结构在一个模拟网络环境中进行评估,它有效地缓解了威胁并增强了网络可视性。为了部署,我们开发了一种软件架构,用于在计算机网络防御场景中评估基于 EBT 的代理。我们的结果表明,基于 EBT 的代理对适应性强的网络攻击具有鲁棒性,并为解释其决策和行动提供了高级解释。