LLM2D
基于假设的理论心智推理-large语言模型
Hypothesis-Driven Theory-of-Mind Reasoning for Large Language Models
作者: Hyunwoo Kim, Melanie Sclar, Tan Zhi-Xuan, Lance Ying, Sydney Levine, Yang Liu, Joshua B. Tenenbaum, Yejin Choi
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11881v1

摘要

arXiv:2502.11881v1 类型: 新增 摘要: 现有的大型语言模型推理方法在各种任务上展现了令人印象深刻的 capability,如解决数学和编程问题。然而,将这些方法应用于缺乏正确答案或基于规则的验证方法的场景中——例如追踪智能体的心理状态——仍然是一个挑战。受到顺序蒙特卡罗算法的启发,我们介绍了思维追溯,这是一种推理算法,设计用于通过生成假设并根据观察结果进行加权,而不依赖于数据集中问题的正确答案来跟踪特定智能体的心理状态。我们的算法基于贝叶斯理论的心理模型框架,使用大型语言模型(LLMs)根据智能体的感知和行为对其心理状态的演变进行概率性推理。我们对多种心理理论基准进行了思维追溯的评估,结果显示其性能明显优于基线大型语言模型。我们的实验还揭示了最近的推理模型——例如o1和R1——在心理理论方面的有趣行为,突出了社会推理与其它领域之间的差异。