LLM2D

摘要

深度强化学习 (DRL) 在自动驾驶、医疗保健和机器人技术等诸多领域取得了显著进展，它使智能体能够通过与环境交互来学习最优策略。然而，DRL 在安全关键领域的应用面临挑战，尤其是在学习策略的安全方面。专注于最大化奖励的 DRL 智能体可能会选择不安全的动作，导致安全违规。因此，运行时安全监控对于确保这些智能体的安全运行至关重要，尤其是在不可预测和动态的环境中。本文介绍了 SMARLA，这是一种专门为 DRL 智能体设计的黑盒安全监控方法。SMARLA 利用机器学习通过观察智能体在执行过程中的行为来预测安全违规。该方法基于 Q 值，Q 值反映了在特定状态下采取行动的预期奖励。SMARLA 采用状态抽象来降低状态空间的复杂性，从而增强监控模型的预测能力。这种抽象能够尽早检测到不安全状态，从而能够在事故发生之前采取纠正和预防措施。我们在深度强化学习研究中广泛使用的三个知名案例研究中对 SMARLA 进行了定量和定性验证。实证结果表明，SMARLA 在预测安全违规方面准确率很高，误报率低，并且可以在违规发生之前，大约在智能体执行过程的一半时就能预测违规。我们还讨论了基于预测违规概率置信区间的不同决策标准，以触发旨在权衡早期检测和低误报率的安全机制。