摘要
arXiv:2302.09859v2 公告类型:替换交叉
摘要:构建道德机器可能涉及赋予它们自我评估和对自身行为悔过的感情能力。尽管道歉代表潜在的战略互动,但明确地将悔过作为行为特征的发展仍然不甚了解。我们的研究探讨了两种形式的情感悔过的共进化:社会悔过涉及成本,需要代理付出努力去理解他人的内心状态和行为;而非社会悔过只涉及对自己状态的认识,不涉及社交成本。借助进化博弈理论的方法,我们从分析、广泛的数值模拟和基于代理的模拟中探讨了悔过是否以及如何进化和部署,这取决于代理系统的基本结构。我们的发现表明,在方形网格和无标度网络中,偏好情感悔过策略在更广泛的悔过和社交成本范围内占主导地位,从而导致更高的合作水平。在结构化的群体中,通过与情感倾向策略的聚类,社会悔过和非社会悔过都能繁盛,从而为防止剥削者提供保护,尤其是对于成本较低的非社会悔过策略。这些见解阐明了悔过与合作之间的复杂交互,增强了我们对道德人工智能的理解。