LLM2D

摘要

arXiv:2410.05127v3 宣称类型: replace-cross 摘要：均场博弈（MFG）是一种用于建模和近似大量代理行为的框架。在多代理强化学习中，计算MFG的均衡态一直是关注点。目前对于最后一次更新的策略收敛到均衡态的理论保证是有限的。我们提议使用一种简单的近端点（PP）类型方法来计算MFG的均衡态。然后，我们提供了首次基于Lasry--Lions型单调性条件的最后一迭代收敛（LIC）保证。我们还基于观察到的近端点更新规则等价于求解正则化MFG这一事实，提出了一种近端点更新规则的近似方法（$\mathtt{APP}$），并且该方法可以由镜下降法求解。我们进一步确立了正则化镜下降法以指数速度实现最后一迭代收敛。我们的数值实验表明，$\mathtt{APP}$能够有效地计算均衡态。