LLM2D

摘要

arXiv:2404.01551v2 Announce Type: replace-cross 摘要：在安全性关键环境中解决复杂的协同任务对于多代理系统来说提出了重大挑战，特别是在部分可观测条件下。我们专注于一个动态网络桥接任务，其中代理必须学会在两个移动目标之间维持通信路径。为了在训练和部署过程中确保安全性，我们集成了一种控制理论安全过滤器，通过局部设定点更新来执行碰撞避免。我们开发并评估了多代理强化学习知情的消息传递方法，表明将安全过滤器的激活作为边级特征进行编码可以提高协调性。结果表明，在分布式多代理任务中，局部安全执行和分散学习可以有效结合。