LLM2D
VCAT:基于漏洞感知和好奇心驱动的对抗训练,提升自动驾驶车辆的鲁棒性
VCAT: Vulnerability-aware and Curiosity-driven Adversarial Training for Enhancing Autonomous Vehicle Robustness
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.12997v1

摘要

arXiv:2409.12997v1 公告类型: 交叉 摘要: 自动驾驶车辆(AVs)在复杂的交通环境中面临严重的安全威胁。对抗训练已成为一种有效的方法,使AVs能够预先加强其对恶意攻击的鲁棒性。通过使用对抗策略训练攻击者,使AV通过与该攻击者的互动学习稳健驾驶。然而,现有方法中的对抗策略往往陷入过度利用已知漏洞的循环,导致AVs的改进效果不佳。为了克服这些限制,我们引入了一种开创性的框架,称为漏洞感知和好奇心驱动的对抗训练(VCAT)。具体来说,在交通车辆攻击者训练阶段,使用代理网络来拟合AV受害者的价值函数,提供关于受害者固有漏洞的密集信息。随后,使用随机网络蒸馏来表征环境的新颖性,构建内在奖励以指导攻击者探索未探索的领域。在受害者防御训练阶段,AV在关键场景中进行训练,其中预训练的攻击者被定位在受害者周围以生成攻击行为。实验结果表明,VCAT提供的训练方法显著提高了基于学习的AVs的鲁棒控制能力,优于传统的训练模式和替代的强化学习对手,显著降低了碰撞率。代码可在https://github.com/caixxuan/VCAT获取。