LLM2D

摘要

原型学习方法为黑盒深度学习模型提供了一种可解释的替代方案。诸如ProtoPNet之类的方案学习测试图像的哪些部分“看起来像”来自训练图像的已知原型部分，将预测能力与基于案例推理的内在可解释性相结合。然而，现有方法有两个主要缺点：A）它们完全依赖于确定性相似度评分，而没有统计置信度。B）原型以黑盒方式学习，没有人工输入。这项工作引入了HyperPg，一种新的原型表示，它利用了潜在空间中超球体上的高斯分布，具有可学习的均值和方差。HyperPg原型适应潜在空间中聚类的分布，并输出似然评分。新的架构HyperPgNet利用HyperPg从像素级注释中学习与人类概念一致的原型。因此，每个原型代表一个特定的概念，例如颜色、图像纹理或图像主体的一部分。基于基础模型的的概念提取管道提供像素级注释，显著减少了人工标注工作量。在CUB-200-2011和斯坦福汽车数据集上的实验表明，HyperPgNet在使用更少的参数和训练步骤的同时，优于其他原型学习架构。此外，与概念一致的HyperPg原型以透明的方式学习，增强了模型的可解释性。