LLM2D

摘要

arXiv:2503.09639v3 宣告类型: 替换-跨领域摘要: 我们能否通过生成性代理模拟沙盒社会，以建模人类行为，从而减少对实际人类试验的过度依赖，评估公共政策的效果？在这项工作中，我们探讨了使用疫苗犹豫作为案例研究，在健康相关决策建模中的可行性。疫苗犹豫被定义为尽管有疫苗接种服务，但因社会动态和疾病相关信息而延迟接受或拒绝疫苗（MacDonald, 2015）。为此，我们引入了一个名为VacSim的框架，该框架包含100个由大型语言模型（LLMs）驱动的生成性代理。VacSim通过以下步骤模拟疫苗政策的结果：1）基于人口普查数据为代理实例化一个具有人口统计特征的群体；2）通过社会网络连接代理，并将疫苗态度建模为社会动态和疾病相关信息的函数；3）设计和评估旨在缓解疫苗犹豫的各种公共卫生干预措施。为了与现实世界的成果保持一致，我们还引入了模拟预热和态度调制，以调整代理的态度。我们提出了一系列评估，以评估各种LLM模拟的可靠性。实验表明，如Llama和Qwen等模型可以模拟人类行为的某些方面，但也突出了现实世界对齐的挑战，如与人口统计数据不一致的响应。这项早期的LLM驱动模拟探索并不旨在作为政策指导的最终依据，而是作为呼吁行动以研究社会模拟对政策制定的影响。