LLM2D

摘要

arXiv:2405.20880v2 宣告类型：替换-交叉摘要：在拍卖等重复游戏中，玩家通常会使用学习算法来选择他们的行动。这种自主学习代理在在线平台上的使用已经很普遍。本文探讨了将货币转移政策纳入玩家代理算法的影响，通过代理之间的动态影响行为以有利于玩家。我们关注的是理解玩家何时有动力使用货币转移、这种支付如何影响学习动态以及对福利及其在玩家之间的分配有何影响。我们提出了一种简单且通用的博弈论模型来捕捉此类场景。我们的通用博弈结果表明，在非常广泛的博弈类型中，自私的玩家从允许他们的学习代理在游戏动态中向其他学习者支付费用中受益，并且在许多情况下，这种行为会提高所有玩家的福利。我们的第一价格拍卖和第二价格拍卖结果表明，在“支付政策博弈”的均衡中，代理的动态达到强烈勾结的结果，且拍卖商收益较低。这些结果提出了新的问题，并突显了在其中自动化学习代理可以通过与数字生态系统中的同伴互动以及超越机制界限的互动而受益的系统中机制设计所面临的挑战。