摘要
arXiv:2505.00610v1 宣告类型: 新
摘要: 针对人工智能(AI)在序列规划中的不信任问题,我们设计了一个基于计算树逻辑指导的大语言模型(LLM)的自然语言解释框架,该框架适用于蒙特卡洛树搜索(MCTS)算法。虽然由于其搜索树的复杂性,MCTS 往往被认为难以解释,但我们的框架足够灵活,可以处理围绕 MCTS 和应用领域马尔可夫决策过程(MDP)的各种自由形式的后验查询和基于知识的询问。通过将用户查询转化为逻辑和变量语句,我们的框架确保从搜索树中获得的证据在事实上与底层环境动力学和实际随机控制过程中的任何约束保持一致。通过定量评估严格评估了该框架,结果显示其在准确性和事实一致性方面表现出色。