摘要
arXiv:2502.02060v1
公告类型: 新颖
摘要: 针对温室气体排放和资源不平等等全球挑战,需要先进的人工智能驱动的自主代理协调。我们提出了一种名为CH-MARL(Constrained Hierarchical Multiagent Reinforcement Learning)的新颖框架,该框架结合了分层决策与动态约束执行和公平意识的奖励塑造。CH-MARL 使用实时的约束执行层来确保遵守全球排放限制,同时加入了公平性指标,促进资源在代理之间的公平分配。在模拟的海运物流环境中的实验显示,排放显著减少,同时公平性和运营效率也得到了提高。除了在该特定领域取得的成功,CH-MARL 为约束下的动态环境中多代理协调挑战提供了一种可扩展且可扩展性的解决方案,从而推动了强化学习的前沿。