LLM2D

摘要

arXiv:2406.17807v4 宣告类型: 替换-交叉摘要: 近期大规模语言模型（LLMs）的进展为生成高质量的游戏解说提供了可能性。然而，为复杂的游戏生成具有洞察力且引人入胜的解说，尤其是在信息不完整的情况下，仍然是一个重大挑战。在这篇论文中，我们提出了一种结合强化学习（RL）和LLMs的新颖解说方法，针对中国的纸牌游戏《关典》（Guandan）进行了专门设计。该系统利用RL生成复杂的牌局场景，并利用LLMs生成相应的解说文本，有效地模拟了专业评论员的战略分析和叙事能力。该框架包括一个状态解说指南、一个基于理论心智（ToM）的策略分析器和一个风格检索模块，这些组件无缝协作，以中文环境提供详细且与情境相关的游戏解说。我们赋予LLMs ToM能力，并改进了检索和信息过滤机制，这促进了个性化解说内容的生成。我们的实验结果展示了提出的解说框架在应用于开源LLMs时的显著性能提升，在多个评估指标上超过了GPT-4。