摘要
arXiv:2502.11881v1 类型: 新增
摘要: 现有的大型语言模型推理方法在各种任务上展现了令人印象深刻的 capability,如解决数学和编程问题。然而,将这些方法应用于缺乏正确答案或基于规则的验证方法的场景中——例如追踪智能体的心理状态——仍然是一个挑战。受到顺序蒙特卡罗算法的启发,我们介绍了思维追溯,这是一种推理算法,设计用于通过生成假设并根据观察结果进行加权,而不依赖于数据集中问题的正确答案来跟踪特定智能体的心理状态。我们的算法基于贝叶斯理论的心理模型框架,使用大型语言模型(LLMs)根据智能体的感知和行为对其心理状态的演变进行概率性推理。我们对多种心理理论基准进行了思维追溯的评估,结果显示其性能明显优于基线大型语言模型。我们的实验还揭示了最近的推理模型——例如o1和R1——在心理理论方面的有趣行为,突出了社会推理与其它领域之间的差异。