LLM2D

摘要

尽管机器学习（ML）和神经网络近年来取得了长足的进步，但对这些系统行为的正式保证仍然是一个悬而未决的问题，也是它们在受监管或安全关键场景中应用的关键要求。我们考虑训练可微分 ML 模型的任务，该模型保证满足设计者选择的属性，这些属性以输入-输出蕴涵的形式给出。由于严格验证和强制执行现代神经模型中的合规性的计算复杂性，这非常具有挑战性。我们提供了一种基于三个组成部分的创新方法：1) 一种通用、简单的架构，能够以保守的语义进行有效的验证；2) 基于投影梯度法的严格训练算法；3) 搜索强反例问题的公式化。所提出的框架几乎不受模型复杂性的影响，能够很好地扩展到实际应用中，并产生提供完整属性满足保证的模型。我们评估了在回归中由线性不等式定义的属性，以及在多标签分类中相互排斥的类别上的方法。我们的方法与基线方法相比具有竞争力，该基线方法包括在预处理（即在训练数据上）和后处理（即在模型预测上）期间执行属性强制。最后，我们的贡献建立了一个框架，打开了多个研究方向和潜在改进。