LLM2D
Home
Arxiv
返回列表
大型语言模型中的理论思维研究综述:评估、表示与安全风险
A Survey of Theory of Mind in Large Language Models: Evaluations, Representations, and Safety Risks
作者:
Hieu Minh "Jord" Nguyen
发布日期:
2/11/2025
arXiv ID:
oai:arXiv.org:2502.06470v1
摘要
arXiv:2502.06470v1 交叉公告类型:理论 摘要:理论思维(ToM),即归因他人心理状态并预测其行为的能力,是社会智能的基础。在本文中,我们回顾了对大型语言模型(LLMs)的行为和表征ToM的研究,识别了高级LLM ToM能力带来的重要安全风险,并建议了几种有效评估和缓解这些风险的研究方向。
查看原文
下载 PDF