LLM2D
大型语言模型中的理论思维研究综述:评估、表示与安全风险
A Survey of Theory of Mind in Large Language Models: Evaluations, Representations, and Safety Risks
作者: Hieu Minh "Jord" Nguyen
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.06470v1

摘要

arXiv:2502.06470v1 交叉公告类型:理论 摘要:理论思维(ToM),即归因他人心理状态并预测其行为的能力,是社会智能的基础。在本文中,我们回顾了对大型语言模型(LLMs)的行为和表征ToM的研究,识别了高级LLM ToM能力带来的重要安全风险,并建议了几种有效评估和缓解这些风险的研究方向。