LLM2D

摘要

仅从动作轨迹学习 STRIPS 动作模型是一个具有挑战性的问题，因为它也涉及学习领域谓词。这项工作引入了一种新方法，它像著名的 LOCM 系统一样具有可扩展性，但像 SAT 方法一样，是健全且完整的。此外，该方法是通用的，并且不对隐藏域或谓词的数量或元数施加任何限制。这种新的学习方法基于一种**高效的新型测试**，该测试检查假设一个谓词受一组动作模式（即具有特定参数位置的动作）的影响是否与轨迹一致。通过测试的谓词和动作模式为学习的领域提供了基础，然后可以很容易地用先决条件和静态谓词来完成它。对这种新方法进行了理论和实验研究。对于后者，该方法在从 8 数码难题等标准经典领域获得的轨迹和图上进行了评估，这些领域涉及数十万个状态和转换。然后在更大的实例上验证学习到的表示。