摘要
arXiv:2502.11122v1 宣告类型: 新增
摘要: 自大语言模型(LLM)的出现以来,LLM 已被广泛应用于写作、翻译和搜索等领域。然而,在处理《星际争霸II》环境中的复杂任务(如决策)方面,基于LLM的方法仍有巨大的潜力待开发。为了应对缺乏相关知识以及在处理不同重要性子任务时控制能力差等问题,我们提出了一种层次专家提示(HEP)方法。我们的方法利用专家级别的战术知识来提高对游戏情况的理解,并通过层次框架提高不同类型任务的处理质量。我们的方法首次击败了TextStarCraft II中最高级别的(精英级)内置代理,并且在其他难度上始终优于基线方法。我们的实验表明,所提出的方法是一种应对复杂决策挑战的实用解决方案。回放视频可以在 https://www.bilibili.com/video/BV1uz42187EF 和 https://youtu.be/dO3PshWLV5M 观看,我们的代码已开源在 https://github.com/luchang1113/HEP-LLM-play-StarCraftII。