LLM2D
SMARLA:一种深度强化学习智能体的安全监控方法
SMARLA: A Safety Monitoring Approach for Deep Reinforcement Learning Agents
作者: Amirhossein Zolfagharian, Manel Abdellatif, Lionel C. Briand, Ramesh S
发布日期: 10/23/2024
arXiv ID: oai:arXiv.org:2308.02594v4

摘要

深度强化学习 (DRL) 在自动驾驶、医疗保健和机器人技术等诸多领域取得了显著进展,它使智能体能够通过与环境交互来学习最优策略。然而,DRL 在安全关键领域的应用面临挑战,尤其是在学习策略的安全方面。专注于最大化奖励的 DRL 智能体可能会选择不安全的动作,导致安全违规。因此,运行时安全监控对于确保这些智能体的安全运行至关重要,尤其是在不可预测和动态的环境中。本文介绍了 SMARLA,这是一种专门为 DRL 智能体设计的黑盒安全监控方法。SMARLA 利用机器学习通过观察智能体在执行过程中的行为来预测安全违规。该方法基于 Q 值,Q 值反映了在特定状态下采取行动的预期奖励。SMARLA 采用状态抽象来降低状态空间的复杂性,从而增强监控模型的预测能力。这种抽象能够尽早检测到不安全状态,从而能够在事故发生之前采取纠正和预防措施。我们在深度强化学习研究中广泛使用的三个知名案例研究中对 SMARLA 进行了定量和定性验证。实证结果表明,SMARLA 在预测安全违规方面准确率很高,误报率低,并且可以在违规发生之前,大约在智能体执行过程的一半时就能预测违规。我们还讨论了基于预测违规概率置信区间的不同决策标准,以触发旨在权衡早期检测和低误报率的安全机制。