摘要
arXiv:2505.03961v2 公告类型:替换
摘要:根据尤瓦尔·诺亚·哈拉里(Yuval Noah Harari)的观点,大规模的人类合作是由包含共同信念和价值观的共享叙述驱动的。本研究探讨这些叙述是否可以类似地促使语言模型(LLM)代理趋向合作。我们使用了一个有限重复的公共物品博弈,在此博弈中,LLM 代理可以选择合作或利己的支出策略。我们将代理器引导至不同程度强调团队合作的故事,并测试这种引导如何影响谈判结果。我们的实验探索了四个问题:(1)叙述如何影响谈判行为?(2)当代理共享相同的故事与不同故事时,结果有何不同?(3)随着代理数量的增长,会发生什么?(4)代理对自利谈判者有何抵抗力?我们发现基于故事的引导显著影响了谈判策略和成功率。共同的故事提高了合作程度,使每个代理受益。相反,引导代理听不同的故事会逆转这一效果,听利己故事的代理占据上风。我们假设这些结果对多代理系统设计和人工智能对齐具有重要意义。