LLM2D
激发LLM代理间合作的自适应信息调制
Instigating Cooperation among LLM Agents Using Adaptive Information Modulation
发布日期: 9/20/2024
arXiv ID: oai:arXiv.org:2409.10372v2

摘要

arXiv:2409.10372v2 公告类型: 替换 摘要: 本文提出了一种新颖的框架,结合了大型语言模型(LLM)代理作为人类战略行为的代理,并通过强化学习(RL)使这些代理在团队环境中进行不断演变的战略互动。我们的方法通过使用战略LLM代理(SLA)并引入通过亲社会促进RL代理(PPA)实现的动态和自适应治理,扩展了传统的基于代理的模拟。PPA代理在网络中调节信息访问,优化社会福利并促进亲社会行为。通过在迭代游戏中进行验证,包括囚徒困境,我们展示了SLA代理表现出细致的战略适应性。PPA代理有效地学习调整信息透明度,从而提高了合作率。该框架为AI介导的社会动态提供了重要见解,有助于AI在现实世界团队环境中的部署。