LLM2D
利用多代理超博弈增强的大型语言模型增强递归推理者逼近人类战略推理
Approximating Human Strategic Reasoning with LLM-Enhanced Recursive Reasoners Leveraging Multi-agent Hypergames
作者: Vince Trencsenyi, Agnieszka Mensfelt, Kostas Stathis
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.07443v1

摘要

arXiv:2502.07443v1 宣告类型: 新 摘要: 基于LLM的多智能体仿真在博弈论和社会仿真领域已逐渐受到关注。尽管大多数实现尝试利用或评估LLM智能体推理,但它们通常使用较弱的智能体概念和简化架构。我们实现了一种基于角色的多智能体战略互动框架,旨在适应复杂递归推理器,提供系统深入开发和评估策略推理的手段。我们的游戏环境由裁判管理,负责从匹配制作到移动生成验证再到环境管理的整个游戏过程。玩家在其决策机制中采用最先进的LLMs,依赖于基于层次信念的正式超博弈模型。我们使用一次性的2人美颜比赛来评估最新LLMs的递归推理能力,将其与经济学中的一种既定基准模型和人类实验的数据进行比较。此外,我们还介绍了关于k级理论的替代语义推理度量的基础。我们的实验表明,人工推理器在模拟人类行为和达到最优解方面均优于基准模型。