LLM2D

摘要

算法代理被广泛应用于各种竞争性决策环境中，尤其是在从在线零售到住宅租赁等各种情境下的价格决策中。“算法串谋”的影响正开始受到商业经理、算法设计师、法律学者和监管机构的关注。我们研究了在代理商之间存在竞争但对所参与的战略互动缺乏了解的情况下，多臂老虎机机器学习算法的涌现行为。在一个通用的重复囚徒困境博弈中，代理商进行在线学习，事先没有博弈结构模型，也不知道竞争对手的状态或行动（例如，没有观察到竞争价格）。我们表明，这些没有对手选择或结果信息的无上下文老虎机仍然会持续学习串谋行为——我们称之为“幼稚串谋”。我们主要通过分析模型来研究这个系统，并通过模拟来检验模型的扰动。我们的研究结果对监管机构具有若干显著意义。首先，限制算法根据竞争对手价格进行调整的呼吁不足以防止算法串谋。这是即使在幼稚情况下也会出现串谋的直接结果。其次，算法的对称性会增加串谋的可能性。这突出了“中心-辐条”算法串谋的一种新的简单机制。中心分销商无需在其算法中灌输超竞争倾向就能出现明显的串谋；它只需使用某些（常见的）机器学习算法即可。最后，我们强调串谋结果严重依赖于所使用的特定算法，并指出了事先无法得知是否会发生串谋的市场和算法条件。