LLM2D
探究交互语言模型中镜像现象的社会一致性
Investigating social alignment via mirroring in a system of interacting language models
作者: Harvey McGuinness, Tianyu Wang, Carey E. Priebe, Hayden Helm
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2412.06834v2

摘要

arXiv:2412.06834v2 声明类型:replace-cross 摘要:对齐是一种社会现象,其中个体共享一个共同的目标或视角。模仿,即模仿他人的行为和观点,是个体对齐的一种机制。由于社会学中传统实验设计的可扩展性限制,大规模研究模仿对对齐的影响受到了限制。本文介绍了简单的计算框架,以研究模仿行为对多agent系统中对齐的影响。我们在这个框架中模拟了相互作用的大规模语言模型系统,并使用代理动力学的定量指标来表征整体系统行为和对齐情况。我们发现,系统行为强烈受到每个代理通信范围的影响,且随着模仿率的增加,这些影响会加剧。我们讨论了模拟系统行为在已知的人类社会动力学背景下的表现。