摘要
arXiv:2406.17807v4 宣告类型: 替换-交叉
摘要: 近期大规模语言模型(LLMs)的进展为生成高质量的游戏解说提供了可能性。然而,为复杂的游戏生成具有洞察力且引人入胜的解说,尤其是在信息不完整的情况下,仍然是一个重大挑战。在这篇论文中,我们提出了一种结合强化学习(RL)和LLMs的新颖解说方法,针对中国的纸牌游戏《关典》(Guandan)进行了专门设计。该系统利用RL生成复杂的牌局场景,并利用LLMs生成相应的解说文本,有效地模拟了专业评论员的战略分析和叙事能力。该框架包括一个状态解说指南、一个基于理论心智(ToM)的策略分析器和一个风格检索模块,这些组件无缝协作,以中文环境提供详细且与情境相关的游戏解说。我们赋予LLMs ToM能力,并改进了检索和信息过滤机制,这促进了个性化解说内容的生成。我们的实验结果展示了提出的解说框架在应用于开源LLMs时的显著性能提升,在多个评估指标上超过了GPT-4。