摘要
arXiv:2502.14160v1 逆向博弈论类型: 交叉
摘要: 在本文中,我们研究了逆向博弈论(即逆向多智能体学习),其目标是在预期行为(即采样行为)为博弈均衡的情况下找到博弈收益函数的参数。我们将这些问题表述为生成式对抗性(即最小-最大)优化问题,并为此开发了多项式时间算法来解决这些问题,前者依赖于精确的一阶黑盒,后者依赖于随机的一阶黑盒。我们将该方法扩展为在多项式时间和样本数量下解决逆向多智能体模拟学习问题。在这些问题中,我们寻求一个模拟器,即找到一组参数和相应的均衡,使其在期望下复制给定的观察结果。我们发现,基于时间序列数据,我们的方法在预测西班牙电力市场价格方面优于广泛使用的ARIMA方法。