LLM2D

摘要

arXiv:2502.02844v1 宣告类型: 交叉摘要: 传统的多智能体强化学习（MARL）中的鲁棒方法在合作场景中往往难以应对协调的恶意攻击。为解决这一局限，我们提出了 Wolfpack 恶意攻击框架，该框架受到狼捕猎策略的启发，旨在破坏初始智能体及其辅助智能体的合作。此外，我们还引入了 Wolfpack-Adversarial Learning for MARL（WALL）框架，通过促进系统范围内的协作来训练鲁棒的 MARL 策略，以防御提出的 Wolfpack 攻击。实验结果强调了 Wolfpack 攻击的毁灭性影响以及 WALL 所取得的重大鲁棒性改进。