摘要
arXiv:2502.09215v1 Announce Type: 横向交叉
摘要:本文提出了一种架构,用于模拟具有预定规范遵从行为的人工智能代理的动作,该行为后来可以由人类控制器更改。当代理涉及时间敏感的救援任务时,将其行为模式从遵守规范更新为更具风险的模式可能是相关的。我们的工作基于 Gelfond 和 Lobo 为规范规范设计的授权和义务政策语言 AOPL。我们引入了一种架构和原型软件系统,可以在不同的行为模式下模拟代理的计划,并且这些模式可以后来由控制器更改。我们设想这种软件对政策制定者来说是有用的,因为它们可以更 easily地理解代理在某些情况下可能如何行动,基于代理对规范遵从的态度。如果模拟显示了不希望的后果,政策制定者可以据此调整其政策。