摘要
arXiv:2411.02158v2 通告类型: 交叉替换
摘要:在严格运行时约束下,顺序解决相似的优化问题对于许多应用至关重要,例如机器人控制、自主驾驶和投资组合管理。在这些设置下,局部优化方法的表现依赖于初始解决方案:糟糕的初始化可能导致收敛速度慢或非最优解。为了解决这一挑战,我们提出了学习预测给定定义问题实例的参数的多种不同的初始解决方案。我们引入了两种利用多种初始解决方案的策略:(i)单优化器方法,其中使用选择函数选择最有前途的初始解;(ii)多优化器方法,其中可以并行运行多个优化器,每个优化器使用不同的初始解初始化,最终选择最优解。值得注意的是,通过包括默认初始化在预测的初始解决方案中,最终输出的成本保证不会高于默认初始化的成本。我们使用不同的优化器(DDP、MPPI 和 iLQR)在三个最优控制基准任务(pole cart、reacher 和自主驾驶)上验证了我们的方法,发现该方法在所有评估设置中均显示出显著且一致的改进,并证明该方法能有效扩展到所需初始解决方案的数量。代码可通过 MISO(https://github.com/EladSharony/miso)获取。