LLM2D

摘要

arXiv:2502.12995v1 宣布类型: 新闻摘要: 深度学习模型是强大的图像分类器，但它们的不透明性阻碍了它们的信任度。由于这些分类器的复杂性和规模，忠实且清晰地捕获其推理过程的方法极为稀缺。我们通过定义一种新的方法来解决这个问题，该方法使用两个代理之间的辩论来解释图像分类器的输出。我们通过具体的自由论辩交换实例（FAXs）获得了这些辩论，这是一种新颖的基于论辩的多代理框架，允许代理以不同于最初所述的方式内化其他代理的意见。我们定义了两个指标（共识率和说服率）来评估FAXs作为图像分类器论辩解释的实用性。随后，我们进行了多项实证实验，表明FAXs在这些指标上表现良好，而且在忠实于图像分类器方面比传统的非论辩解释方法更好。我们的所有实现可以在https://github.com/koriavinash1/FAX找到。