LLM2D

摘要

arXiv:2410.14311v2 宣告类型: 替换-交叉摘要: 人工智能代理将以某些传统代理无法预测的方式表现出可预测性。我们如何利用这种可预测性来提高社会福利？我们在这个背景下研究了这个问题，其中一个代理支付固定成本以模拟另一个代理，从而学习其混合策略。作为负面结果，我们证明，在所谓的“广义信任游戏”中，与此前关于纯策略模拟的工作不同，启用混合策略模拟可能不再能对两玩家的全部情况下带来更好的结果。实际上，在模拟对象的动作可以依赖于模拟者的任何游戏中，混合策略模拟都没有帮助。我们还展示了，在一般情况下，判断模拟是否在一个给定的游戏中引入帕累托改进纳什均衡是NP难问题。作为积极的结果，我们证明，在模拟者有调整其信任水平选项、玩家面临信任和协调双重挑战或保持一定水平的隐私对于促进合作是必不可少的情况下，混合策略模拟可以提高社会福利。