摘要
arXiv:2501.19256v1 通知类型: 新
摘要: 解释是人类的基本过程。理解解释的目标和受众至关重要,但现有可解释强化学习(XRL)的工作通常不咨询人类在评估中的意见。即使他们这样做,他们通常还是会依赖于主观度量标准,如信心或理解,这些度量标准只能告知研究人员用户的观点,而不能反映特定问题的实际有效性。本文呼吁研究者使用基于可观察和可行动的行为的客观人类度量标准进行解释评估,以构建更具可重复性、可比较性和基于知识的研究。为此,我们整理、描述并比较了几种客观评估方法,用于应用解释来调试智能体行为和支持人类-智能体团队合作,并使用一个新颖的基于网格的环境来说明我们提出的评估方法。我们讨论了主观和客观度量标准如何相互补充,以提供全面验证,并讨论了未来工作需要利用标准化基准进行测试,以使不同研究之间的比较更为广泛。