LLM2D
超球面上的原型高斯分布:一种可解释深度学习方法
HyperPg -- Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning
作者: Maximilian Xiling Li, Korbinian Franz Rudolf, Nils Blank, Rudolf Lioutikov
发布日期: 10/14/2024
arXiv ID: oai:arXiv.org:2410.08925v1

摘要

原型学习方法为黑盒深度学习模型提供了一种可解释的替代方案。诸如ProtoPNet之类的方案学习测试图像的哪些部分“看起来像”来自训练图像的已知原型部分,将预测能力与基于案例推理的内在可解释性相结合。然而,现有方法有两个主要缺点:A)它们完全依赖于确定性相似度评分,而没有统计置信度。B)原型以黑盒方式学习,没有人工输入。这项工作引入了HyperPg,一种新的原型表示,它利用了潜在空间中超球体上的高斯分布,具有可学习的均值和方差。HyperPg原型适应潜在空间中聚类的分布,并输出似然评分。新的架构HyperPgNet利用HyperPg从像素级注释中学习与人类概念一致的原型。因此,每个原型代表一个特定的概念,例如颜色、图像纹理或图像主体的一部分。基于基础模型的的概念提取管道提供像素级注释,显著减少了人工标注工作量。在CUB-200-2011和斯坦福汽车数据集上的实验表明,HyperPgNet在使用更少的参数和训练步骤的同时,优于其他原型学习架构。此外,与概念一致的HyperPg原型以透明的方式学习,增强了模型的可解释性。