LLM2D
狼群 adversarial 攻击以提高多智能体强化学习的鲁棒性
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning
作者: Sunwoo Lee, Jaebak Hwang, Yonghyeon Jo, Seungyul Han
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2502.02844v1

摘要

arXiv:2502.02844v1 宣告类型: 交叉 摘要: 传统的多智能体强化学习(MARL)中的鲁棒方法在合作场景中往往难以应对协调的恶意攻击。为解决这一局限,我们提出了 Wolfpack 恶意攻击框架,该框架受到狼捕猎策略的启发,旨在破坏初始智能体及其辅助智能体的合作。此外,我们还引入了 Wolfpack-Adversarial Learning for MARL(WALL)框架,通过促进系统范围内的协作来训练鲁棒的 MARL 策略,以防御提出的 Wolfpack 攻击。实验结果强调了 Wolfpack 攻击的毁灭性影响以及 WALL 所取得的重大鲁棒性改进。