LLM2D

摘要

概率逻辑模型是神经符号人工智能的核心组成部分，并且是自身在需要高度可解释性的任务中重要的模型。与神经网络不同，逻辑模型通常使用领域专业知识手工制作，这使得它们的开发成本高昂且容易出错。虽然存在从数据中学习逻辑模型的算法，但它们通常非常昂贵，限制了它们在现实世界中的适用性。在这项工作中，我们引入了逻辑规则的精确度和召回率，并将它们的组合定义为规则效用——一种经济有效的度量方法，用于评估逻辑模型的预测能力。此外，我们引入了 SPECTRUM，一个用于从关系数据中学习逻辑模型的可扩展框架。它的可扩展性源于一个线性时间算法，该算法挖掘数据中的循环结构，以及一个使用廉价效用度量方法有效地对从这些结构构建的规则进行排序的第二个算法。此外，我们推导出关于学习到的逻辑模型效用的理论保证。因此，SPECTRUM 在真实世界数据集上比以前的方法快几个数量级地学习到更准确的逻辑模型。