LLM2D

摘要

arXiv:2502.09215v1 Announce Type: 横向交叉摘要：本文提出了一种架构，用于模拟具有预定规范遵从行为的人工智能代理的动作，该行为后来可以由人类控制器更改。当代理涉及时间敏感的救援任务时，将其行为模式从遵守规范更新为更具风险的模式可能是相关的。我们的工作基于 Gelfond 和 Lobo 为规范规范设计的授权和义务政策语言 AOPL。我们引入了一种架构和原型软件系统，可以在不同的行为模式下模拟代理的计划，并且这些模式可以后来由控制器更改。我们设想这种软件对政策制定者来说是有用的，因为它们可以更 easily地理解代理在某些情况下可能如何行动，基于代理对规范遵从的态度。如果模拟显示了不希望的后果，政策制定者可以据此调整其政策。