LLM2D

摘要

arXiv:2502.06470v1 交叉公告类型：理论摘要：理论思维（ToM），即归因他人心理状态并预测其行为的能力，是社会智能的基础。在本文中，我们回顾了对大型语言模型（LLMs）的行为和表征ToM的研究，识别了高级LLM ToM能力带来的重要安全风险，并建议了几种有效评估和缓解这些风险的研究方向。