摘要
arXiv:2502.08932v1 宣布类型: 新
摘要: 要创建可使用且可部署的人工智能(AI)系统,在多种不同条件下保证其性能至关重要。很多时候,部署的机器学习系统需要通过神经符号程序和人工神经网络感知联合进行更多经典的逻辑和推理。虽然许多先前的研究仅集中于系统的一个组件,要么是单独的神经网络,要么是整个企业系统,来单独保证其安全性,但很少有研究关注整合的神经符号系统的安全性。在这项工作中,我们评估了端到端完全可微分的神经符号系统,这是一种新兴方法,用于创建数据高效且更可解释的模型。我们使用Scallop,一个端到端的神经符号库,在图像和音频领域内的分类和推理任务中进行了这一研究。我们评估了端到端的保障性,包括对抗鲁棒性、校准、用户性能平等以及解决方案的可解释性,用于发现未对齐的解决方案。我们发现,端到端的神经符号方法通过实验结果提供了独特的保障机会,但并非在所有方面都如此。我们发现,当定义了算术操作且输入空间维度高时,这类神经符号模型在保证性方面优于完全神经网络的对手,因为它们在学习鲁棒推理操作方面困难重重。我们确定了神经符号模型的可解释性与其捕捉导致了更大对抗性脆弱性的捷径之间的关系,尽管性能平等。最后,我们发现数据效率的承诺通常仅在类不平衡的推理问题中成立。