摘要
arXiv:2501.17282v3 宣告类型: 更新
摘要: 我们提出了一种框架,利用大规模语言模型(LLMs)和上下文学习来将自然语言中的游戏描述转换为博弈论中的广义形式表示。由于游戏中的战略复杂性各不相同,例如完美信息与不完美信息,直接应用上下文学习是不够的。为了解决这个问题,我们提出了一种两阶段框架,其中包含专门的模块来增强上下文学习,使其能够有效地区分和解决这个问题。在第一阶段,我们通过开发一个模块来应对不完美信息的挑战,该模块能够识别信息集及其相应的部分树结构。借助这些信息,第二阶段利用上下文学习及其自调试模块,生成一个完整的广义形式游戏树,使用 pygambit 进行表示,pygambit 是博弈论分析工具 Gambit 的 Python API。通过使用这种 Python 表示,可以自动化从自然语言描述直接计算纳什均衡等任务。我们使用不同战略复杂性的游戏对整个框架及其各个组件进行了评估。实验结果表明,该框架在生成准确的广义形式游戏方面显著优于基准模型,每个模块都在其成功中扮演了关键角色。