LLM2D
增强不完美信息纸牌游戏的评论策略:关于Guandan评论的大语言模型研究
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary
作者: Meiling Tao, Xuechen Liang, Xinyuan Song, Yangfan He, Yiling Tao, Jianhui Wang, Sun Li Tianyu Shi
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2406.17807v5

摘要

arXiv:2406.17807v5 宣告类型: replace-cross 摘要:大型语言模型(LLMs)的最新进展为生成高质量的游戏评论打开了可能性。然而,为具有不完整信息的复杂游戏生成深入且引人入胜的评论仍然是一个重大挑战。在这篇论文中,我们介绍了一种结合强化学习(RL)和LLMs的新评论方法,特别适用于中国的牌类游戏《观坛》。我们的系统利用RL生成复杂的牌局场景,并运用LLMs生成相应的评论文本,有效地模拟了专业评论员的战略分析和叙事能力。该框架包括一个状态评论指南、一种基于心智理论(ToM)的战略分析器和一个风格检索模块,这些模块无缝协作,提供详尽且与背景相关的中文游戏评论。我们赋予LLMs心智理论能力,并优化了检索和信息过滤机制,这促进了个性化评论内容的生成。我们的实验结果展示了当应用于开源LLMs时,提出的评论框架在多个评估指标上超过了GPT-4,实现了显著性能提升。