LLM2D

摘要

arXiv:2412.06834v2 声明类型：replace-cross 摘要：对齐是一种社会现象，其中个体共享一个共同的目标或视角。模仿，即模仿他人的行为和观点，是个体对齐的一种机制。由于社会学中传统实验设计的可扩展性限制，大规模研究模仿对对齐的影响受到了限制。本文介绍了简单的计算框架，以研究模仿行为对多agent系统中对齐的影响。我们在这个框架中模拟了相互作用的大规模语言模型系统，并使用代理动力学的定量指标来表征整体系统行为和对齐情况。我们发现，系统行为强烈受到每个代理通信范围的影响，且随着模仿率的增加，这些影响会加剧。我们讨论了模拟系统行为在已知的人类社会动力学背景下的表现。