LLM2D

摘要

外交是人类社会最复杂精妙的活动之一。多方/多主体间的复杂互动涉及多种能力，例如社会推理、谈判技巧和长期战略规划。以往的AI智能体已证明其在涉及多个智能体的任务中处理多步骤博弈和更大动作空间的能力。然而，外交涉及极其庞大的决策空间，尤其是在需要谈判阶段的情况下。最近，大型语言模型（LLM）智能体在一些应用中展现了其超越以往智能体的潜力，然而，它仍然不足以应对复杂多主体环境中极长的规划周期。借助最先进的LLM技术，我们首次尝试探索AI在如此高度综合的多主体任务中实现类人智能体的上限，方法是结合三种对更强大的基于LLM的社会智能体至关重要的核心能力：1）具有记忆和反思能力的战略规划者；2）具有社会推理能力的目标导向型谈判者；3）通过自我博弈来增强记忆，实现无需人工干预的自我进化。