LLM2D

摘要

大型语言模型 (LLM) 的最新进展使更丰富的社会模拟成为可能，从而可以研究各种社会现象。然而，大多数最近的工作在这些模拟中采用了更无所不知的视角（例如，单个 LLM 生成所有对话者），这与现实世界中涉及人类和 AI 代理的非无所不知、信息不对称的互动存在根本矛盾。为了检验这些差异，我们开发了一个评估框架，用于在各种环境（无所不知、非无所不知）下模拟 LLM 的社会互动。我们的实验表明，LLM 在不切实际的、无所不知的模拟环境中表现更好，但在更准确地反映现实世界条件的信息不对称环境中却难以应对。我们的研究结果表明，解决信息不对称仍然是基于 LLM 的代理面临的一个根本挑战。