LLM2D
通过自适应梯度蒙蔽 adversarial 攻击实现机器人领域的鲁棒深度强化学习
Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks
作者: Zongyuan Zhang, Tianyang Duan, Zheng Lin, Dong Huang, Zihan Fang, Zekai Sun, Ling Xiong, Hongbin Liang, Heming Cui, Yong Cui, Yue Gao
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.20844v1

摘要

arXiv:2503.20844v1 攻击类型: 对抗 摘要:深度强化学习(DRL)已成为机器人控制的一个有前途的方法,但由于其对环境扰动的脆弱性,其在现实世界中的部署仍然具有挑战性。现有的源自监督学习的白盒对抗攻击方法无法有效针对DRL代理,因为它们忽略了时间动态性,并且随机扰动所有状态维度,这限制了它们对长期回报的影响。为了解决这些挑战,我们提出了自适应梯度-蒙蔽强化(AGMR)攻击,这是一种结合了DRL和基于梯度的软蒙蔽机制的白盒攻击方法,可以动态地识别关键状态维度并优化对抗策略。AGMR根据最有影响力的状态特征分配扰动,并通过引入动态调整机制在训练过程中平衡探索与利用。广泛的实验表明,AGMR在降低受害代理性能方面优于最先进的对抗攻击方法,并通过对抗防御机制增强受害代理的鲁棒性。