LLM2D

摘要

arXiv:2409.12997v1 公告类型: 交叉摘要: 自动驾驶车辆(AVs)在复杂的交通环境中面临严重的安全威胁。对抗训练已成为一种有效的方法，使AVs能够预先加强其对恶意攻击的鲁棒性。通过使用对抗策略训练攻击者，使AV通过与该攻击者的互动学习稳健驾驶。然而，现有方法中的对抗策略往往陷入过度利用已知漏洞的循环，导致AVs的改进效果不佳。为了克服这些限制，我们引入了一种开创性的框架，称为漏洞感知和好奇心驱动的对抗训练(VCAT)。具体来说，在交通车辆攻击者训练阶段，使用代理网络来拟合AV受害者的价值函数，提供关于受害者固有漏洞的密集信息。随后，使用随机网络蒸馏来表征环境的新颖性，构建内在奖励以指导攻击者探索未探索的领域。在受害者防御训练阶段，AV在关键场景中进行训练，其中预训练的攻击者被定位在受害者周围以生成攻击行为。实验结果表明，VCAT提供的训练方法显著提高了基于学习的AVs的鲁棒控制能力，优于传统的训练模式和替代的强化学习对手，显著降低了碰撞率。代码可在https://github.com/caixxuan/VCAT获取。