LLM2D

摘要

arXiv:2503.23615v1 宣布类型: 新摘要: 多智能体强化学习可以促进表现出与组织概念相似协作行为的智能体的发展。在此视角基础上，我们提出了一种新的框架，该框架明确将 $\mathcal{M}OISE^+$ 模型中的组织角色和目标整合到多智能体强化学习过程中，引导智能体满足相应的组织约束。通过基于角色和目标进行结构化训练，我们旨在提升组织层面智能体行为的可解释性和可控性，而现有文献主要关注个体智能体。此外，我们的框架包含一种后训练分析方法，用于推断隐含的角色和目标，从而提供对智能体涌现行为的洞察。该框架已在多种多智能体强化学习环境和算法中得到应用，展示了预定义的组织规格与从训练智能体中推断出的规格之间的一致性。