LLM2D

摘要

arXiv:2503.20844v1 攻击类型: 对抗摘要：深度强化学习（DRL）已成为机器人控制的一个有前途的方法，但由于其对环境扰动的脆弱性，其在现实世界中的部署仍然具有挑战性。现有的源自监督学习的白盒对抗攻击方法无法有效针对DRL代理，因为它们忽略了时间动态性，并且随机扰动所有状态维度，这限制了它们对长期回报的影响。为了解决这些挑战，我们提出了自适应梯度-蒙蔽强化（AGMR）攻击，这是一种结合了DRL和基于梯度的软蒙蔽机制的白盒攻击方法，可以动态地识别关键状态维度并优化对抗策略。AGMR根据最有影响力的状态特征分配扰动，并通过引入动态调整机制在训练过程中平衡探索与利用。广泛的实验表明，AGMR在降低受害代理性能方面优于最先进的对抗攻击方法，并通过对抗防御机制增强受害代理的鲁棒性。