摘要
arXiv:2502.07443v1 宣告类型: 新
摘要: 基于LLM的多智能体仿真在博弈论和社会仿真领域已逐渐受到关注。尽管大多数实现尝试利用或评估LLM智能体推理,但它们通常使用较弱的智能体概念和简化架构。我们实现了一种基于角色的多智能体战略互动框架,旨在适应复杂递归推理器,提供系统深入开发和评估策略推理的手段。我们的游戏环境由裁判管理,负责从匹配制作到移动生成验证再到环境管理的整个游戏过程。玩家在其决策机制中采用最先进的LLMs,依赖于基于层次信念的正式超博弈模型。我们使用一次性的2人美颜比赛来评估最新LLMs的递归推理能力,将其与经济学中的一种既定基准模型和人类实验的数据进行比较。此外,我们还介绍了关于k级理论的替代语义推理度量的基础。我们的实验表明,人工推理器在模拟人类行为和达到最优解方面均优于基准模型。