LLM2D
自由论辩交换以解释图像分类器
Free Argumentative Exchanges for Explaining Image Classifiers
作者: Avinash Kori, Antonio Rago, Francesca Toni
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.12995v1

摘要

arXiv:2502.12995v1 宣布类型: 新闻 摘要: 深度学习模型是强大的图像分类器,但它们的不透明性阻碍了它们的信任度。由于这些分类器的复杂性和规模,忠实且清晰地捕获其推理过程的方法极为稀缺。我们通过定义一种新的方法来解决这个问题,该方法使用两个代理之间的辩论来解释图像分类器的输出。我们通过具体的自由论辩交换实例(FAXs)获得了这些辩论,这是一种新颖的基于论辩的多代理框架,允许代理以不同于最初所述的方式内化其他代理的意见。我们定义了两个指标(共识率和说服率)来评估FAXs作为图像分类器论辩解释的实用性。随后,我们进行了多项实证实验,表明FAXs在这些指标上表现良好,而且在忠实于图像分类器方面比传统的非论辩解释方法更好。我们的所有实现可以在https://github.com/koriavinash1/FAX找到。