LLM2D

摘要

arXiv:2503.23326v1 宣布类型: 新摘要:Monte-Carlo Tree Search (MCTS) 是一类用于顺序决策领域在线规划的基于采样的搜索算法, 并且是近年来人工智能许多进展的核心。由于模拟多种可能的未来、评估它们并确定它们之间的关系, MCTS代理的行为对于开发人员和用户来说是难以理解的, 因为此类搜索树通常非常庞大且复杂。本文介绍了我们对MCTS的决策和行为潜在解释的持续研究。MCTS的一个缺点是它构建了一个高度选择性的树, 结果可能会错过关键的移动并陷入战术陷阱。全宽度Minimax搜索构成了解决方案。我们将在多玩家MCTS的展开阶段整合浅层Minimax搜索, 并使用过程挖掘技术来解释3v3跳棋中代理的策略。