LLM2D

摘要

arXiv:2502.06575v1 宣告类型: cross 摘要: 通过模拟学习训练的视知觉运动策略能够在执行复杂的操作任务中表现出色，但它们往往对光照、视觉干扰和物体位置等环境因素极为脆弱。这些弱点可能由于训练的具体情况而不可预测，且在不进行耗时且昂贵的硬件评估的情况下很难暴露。我们提出了预测红队攻击的问题：发现策略在环境因素方面的弱点，并在无硬件评估的情况下预测对应的性能下降。为了实现这一目标，我们开发了RoboART：一个自动化的红队（ART）流水线，（1）使用生成图像编辑方法修改标准观察结果，以改变不同的环境因素，（2）使用针对编辑观察结果执行的特定策略异常检测器来预测每种变化下的性能。在十二种非正常情景中的500多次硬件试验中，对于视知觉扩散策略，RoboART在性能下降预测方面表现出高度准确性（预测成功率为实际成功率的平均差异小于0.19）。我们还展示了预测红队攻击如何 enable 目标数据收集：在预测为不利条件下的数据收集进行微调能够将基线性能提高2-7倍。