摘要
arXiv:2503.09639v3 宣告类型: 替换-跨领域
摘要: 我们能否通过生成性代理模拟沙盒社会,以建模人类行为,从而减少对实际人类试验的过度依赖,评估公共政策的效果?在这项工作中,我们探讨了使用疫苗犹豫作为案例研究,在健康相关决策建模中的可行性。疫苗犹豫被定义为尽管有疫苗接种服务,但因社会动态和疾病相关信息而延迟接受或拒绝疫苗(MacDonald, 2015)。为此,我们引入了一个名为VacSim的框架,该框架包含100个由大型语言模型(LLMs)驱动的生成性代理。VacSim通过以下步骤模拟疫苗政策的结果:1)基于人口普查数据为代理实例化一个具有人口统计特征的群体;2)通过社会网络连接代理,并将疫苗态度建模为社会动态和疾病相关信息的函数;3)设计和评估旨在缓解疫苗犹豫的各种公共卫生干预措施。为了与现实世界的成果保持一致,我们还引入了模拟预热和态度调制,以调整代理的态度。我们提出了一系列评估,以评估各种LLM模拟的可靠性。实验表明,如Llama和Qwen等模型可以模拟人类行为的某些方面,但也突出了现实世界对齐的挑战,如与人口统计数据不一致的响应。这项早期的LLM驱动模拟探索并不旨在作为政策指导的最终依据,而是作为呼吁行动以研究社会模拟对政策制定的影响。