LLM2D
流匹配遍历覆盖
Flow Matching Ergodic Coverage
作者: Max Muchen Sun, Allison Pinosky, Todd Murphey
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.17872v1

摘要

arXiv:2504.17872v1 类型:交叉 摘要:遍历覆盖通过使代理轨迹的空间分布与目标分布对齐来有效生成探索行为,其中这些两种分布之间的差异通过遍历度量进行度量。然而,现有的遍历覆盖方法受限于可用于控制合成的遍历度量有限的集合,从根本上限制了它们的性能。在本文中,我们提出了一种基于流匹配的替代遍历覆盖方法,这是一种广泛用于生成推理以实现高效和可扩展采样的技术。我们正式推导了遍历覆盖的流匹配问题,并表明它等价于具有闭式解的线性二次调节器问题。我们的建模使我们可以从生成推理中采用替代的遍历度量,从而克服现有度量的限制。这些度量先前对于控制合成来说是不可行的,但现在可以通过无需计算开销的方式进行支持。具体而言,基于Stein变分梯度流的流匹配可以直接在目标分布的得分函数上进行控制合成,从而提高对未正常化分布的鲁棒性;另一方面,基于Sinkhorn散度流的流匹配实现了一种基于最优传输的遍历度量,从而在具有不规则支持的非光滑分布上提高了覆盖性能。我们通过全面的数值基准和不同非线性动力学来验证我们方法的改进性能和具有竞争力的计算效率。我们还通过Franka机器人上的一系列绘图和擦除任务展示了我们方法的实际可行性。