LLM2D

摘要

arXiv:2504.06611v1 类型: cross 摘要: 本文探索了内在共知动机的本质，假设人类即使在没有外部奖励的情况下，也有一种基本的愿望去理解他人，并希望被他人理解。通过感知交叉范式的模拟，我们探讨了强化学习代理的各种内在奖励函数的效果。理解的驱动力被实现为一种类似主动推理的拟真好奇心奖励，而被理解的驱动力则通过模仿、影响/可模仿性以及对另一个体的次反应时间的预期的内在奖励来实现。结果表明，尽管单独的好奇心奖励并不能导致对社交互动的偏好，但强调相互理解的奖励确实能够驱动代理优先进行互动。我们证明，这种内在动机可以在仅有一个代理因另一个代理的行为而获得外部奖励的任务中促进合作。