摘要
arXiv:2502.02060v1 通知类型: 新
摘要: 应对全球挑战,如温室气体排放和资源不平等,需要先进的基于人工智能的自主代理协调。我们提出了一种新的框架CH-MARL(Constrained Hierarchical Multiagent Reinforcement Learning,受限层级多智能体强化学习),该框架结合了层级决策制定与动态约束执行以及公平意识的奖励塑造。CH-MARL 使用实时约束执行层以确保遵守全球排放限制,同时整合了公平性指标,以促进资源在代理之间的公平分配。在仿真实际物流环境中的实验表明,CH-MARL 显著减少了排放,并提高了公平性和运营效率。除了在特定领域的成功外,CH-MARL 还提供了一种在受限和动态环境中多智能体协调挑战的可扩展和可泛化的解决方案,从而推动了强化学习的技术前沿。