LLM2D

摘要

arXiv:2409.10372v2 公告类型: 替换摘要: 本文提出了一种新颖的框架，结合了大型语言模型（LLM）代理作为人类战略行为的代理，并通过强化学习（RL）使这些代理在团队环境中进行不断演变的战略互动。我们的方法通过使用战略LLM代理（SLA）并引入通过亲社会促进RL代理（PPA）实现的动态和自适应治理，扩展了传统的基于代理的模拟。PPA代理在网络中调节信息访问，优化社会福利并促进亲社会行为。通过在迭代游戏中进行验证，包括囚徒困境，我们展示了SLA代理表现出细致的战略适应性。PPA代理有效地学习调整信息透明度，从而提高了合作率。该框架为AI介导的社会动态提供了重要见解，有助于AI在现实世界团队环境中的部署。