LLM2D

摘要

arXiv:2504.21643v1 通知类型: 新摘要：在动态且不确定的现实环境中部署机器人时，实现安全自主导航系统至关重要。本文提出了一种基于神经网络验证技术的分层控制框架，用于设计控制障碍函数（CBF）和策略纠正机制，以确保安全的强化学习导航策略。我们的方法依赖于概率枚举来识别操作中的不安全区域，然后利用这些区域构建适用于任意策略的安全CBF控制层。我们在仿真和真实机器人上验证了此框架，使用标准的移动机器人基准和一个高度动态的水下环境监测任务。这些实验展示了所提出解决方案纠正不安全行为并保持高效导航行为的能力。我们的结果表明，开发基于分层验证的系统以在复杂场景中实现安全稳健的导航行为具有很大潜力。