LLM2D

摘要

arXiv:2505.04525v1 声明类型: 新摘要: 本文首次对四种未经过实验测试的 Unbounded Best-First Minimax 算法的修改版本进行了实验评估。该算法通过迭代扩展当前部分游戏树中最有希望的动作序列来探索游戏树。我们首先评估了转置表的使用情况，它通过合并重复状态将游戏树转换为有向无环图。其次，我们将 Korf & Chickering 的原始算法与 Cohen-Solal 提出的变体进行了比较，后者在回传策略上有所不同：在遇到稳定值时不会停止，而是更新值直到根节点。这一变化在涉及值匹配或转置表时略微提高了性能。第三，我们评估了用学习得来的启发式函数替换准确的终端评估函数的效果。虽然在准确评估成本较高的情况下有利，但此修改在成本较低的设置中会降低性能。最后，我们研究了优先处理已解决的胜利状态并避免已解决的失败状态的完成技术，这种技术也提高了性能。总体而言，我们的发现强调了有针对性的修改如何可以提升 Unbounded Best-First Minimax 的效率。