摘要
arXiv:2402.10726v3 宣告类型: 替换
摘要: 前述从状态轨迹学习的STRIPS领域模型获取方法从要学习的动作的名称和参数开始。因此,它们的任务仅仅是推断给定动作的先件和结果。在本项工作中,我们探讨了当学习的动作参数未提供时的学习情况。我们基于所提供的信息定义了两种轨迹质量级别,并为此每种情况提供了一个算法。在一种级别(L1)中,轨迹中的状态标记有动作名称,因此我们可以推断出动作的数量和名称,但仍需确定参数的数量和类型。在另一种级别(L2)中,状态还标记有构成相应接地动作参数的物体。在此情况下,我们仍需推断学习动作的参数类型。我们在一个大型IPC基准集合上实验性地评估了提出的方法,并将其与最先进的学习工具FAMA进行了比较。评估结果显示,我们新的算法更快,能处理更大的输入,并在学习动作模型方面提供了更好的结果,使其更为接近参考模型。