LLM2D

摘要

arXiv:2504.06611v2 公告类型: replace-cross 摘要：本文探讨了相互意识的内在动机，假设人类即使在缺乏外在奖励的情况下，也具有一种基本的驱动力，即理解他人和被他人理解。通过感知交叉范式的模拟，我们探讨了强化学习代理内部奖励函数的不同效应。希望理解他人的驱动力被实现为一种类似于主动推断的人工好奇奖励，而被他人理解的驱动力则通过模仿、影响/可影响性和对方的次反应时间预期的内在奖励来实现。结果显示，仅凭人工好奇奖励并不能导致对社交互动的偏好，而注重相互理解的奖励成功地促使代理优先进行互动。我们展示了这种内在动机在仅有一个代理因另一方的行为而获得外在奖励的任务中可以促进合作。