LLM2D
ExpProof:利用零知识证明操作化保密模型的解释方法
ExpProof : Operationalizing Explanations for Confidential Models with ZKPs
作者: Chhavi Yadav, Evan Monroe Laufer, Dan Boneh, Kamalika Chaudhuri
发布日期: 2/7/2025
arXiv ID: oai:arXiv.org:2502.03773v1

摘要

arXiv:2502.03773v1 说明类型: cross 摘要:原则上,说明是为了增加对机器学习模型的信任,并且经常被法规要求。然而,在这些说明被要求的许多情况下都是敌对性的,这意味着参与各方的利益不一致,并且有动机操纵说明以服务于自己的目的。因此,尽管存在需求,解释方法在敌对场景中无法发挥作用,尽管存在需求\[参考:bordt2022post\]。在本文中,我们通过零知识证明(ZKPs)这一密码学原语,朝着在敌对场景中实现说明迈出了一步。具体而言,我们研究了流行的解释算法LIME的零知识证明可适应版本,并在神经网络和随机森林上评估了它们的性能。