LLM2D

摘要

arXiv:2406.17807v5 宣告类型: replace-cross 摘要：大型语言模型（LLMs）的最新进展为生成高质量的游戏评论打开了可能性。然而，为具有不完整信息的复杂游戏生成深入且引人入胜的评论仍然是一个重大挑战。在这篇论文中，我们介绍了一种结合强化学习（RL）和LLMs的新评论方法，特别适用于中国的牌类游戏《观坛》。我们的系统利用RL生成复杂的牌局场景，并运用LLMs生成相应的评论文本，有效地模拟了专业评论员的战略分析和叙事能力。该框架包括一个状态评论指南、一种基于心智理论（ToM）的战略分析器和一个风格检索模块，这些模块无缝协作，提供详尽且与背景相关的中文游戏评论。我们赋予LLMs心智理论能力，并优化了检索和信息过滤机制，这促进了个性化评论内容的生成。我们的实验结果展示了当应用于开源LLMs时，提出的评论框架在多个评估指标上超过了GPT-4，实现了显著性能提升。