摘要
arXiv:2403.17338v3 宣告类型: 替换-交叉
摘要:最优控制方法为解决安全关键问题提供了解决方案,但由于其复杂性,往往变得难以处理。控制障碍函数(CBFs)因其通过其前向不变性性质可以验证地保证安全性而成为一种流行的技巧,尽管这会带来一些性能损失。这种方法涉及定义一个性能目标以及基于CBF的必须始终遵循的安全约束。不幸的是,性能和解的可行性都严重受到两个关键因素的影响:(i) 成本函数及其参数的选择,以及(ii) 基于CBF的约束中的参数校准,这些约束捕获了性能与保守性的权衡。为了解决这些挑战,我们提出了一种基于强化学习(RL)的前瞻性控制(RHC)方法,利用具有CBF的模型预测控制(MPC-CBF)。特别是,我们参数化控制器并使用双层优化,其中RL用于学习最优参数,而MPC计算最优控制输入。我们通过将其应用于交叉道路中连接和自动化车辆(CAVs)的自动化合并控制问题来验证我们的方法。结果显示,与传统用于调参的启发式方法相比,该方法在性能上有所提升,并显著减少了不可行情况的数量,从而展示了所提方法的有效性。