摘要
arXiv:2503.20844v1 攻击类型: 对抗
摘要:深度强化学习(DRL)已成为机器人控制的一个有前途的方法,但由于其对环境扰动的脆弱性,其在现实世界中的部署仍然具有挑战性。现有的源自监督学习的白盒对抗攻击方法无法有效针对DRL代理,因为它们忽略了时间动态性,并且随机扰动所有状态维度,这限制了它们对长期回报的影响。为了解决这些挑战,我们提出了自适应梯度-蒙蔽强化(AGMR)攻击,这是一种结合了DRL和基于梯度的软蒙蔽机制的白盒攻击方法,可以动态地识别关键状态维度并优化对抗策略。AGMR根据最有影响力的状态特征分配扰动,并通过引入动态调整机制在训练过程中平衡探索与利用。广泛的实验表明,AGMR在降低受害代理性能方面优于最先进的对抗攻击方法,并通过对抗防御机制增强受害代理的鲁棒性。