摘要
arXiv:2310.16316v3 宣告类型: 替换-交叉
摘要: 自归因神经网络(SANNs)为高维问题的可解释模型提供了潜在的道路,但往往在性能上面临显著的权衡。在本文中,我们正式证明了单特征SANNs的误差下界,而基于组的SANNs可以实现零误差,从而获得高性能。基于这些洞见,我们提出了Sum-of-Parts(SOP)框架,将任何可微模型转换为基于组的SANN,其中特征组通过端到端的学习学习,而不需组监督。SOP在视觉和语言任务中实现了SANNs的最优性能,并且我们通过一系列定量和语义指标验证了组的可解释性。我们进一步验证了SOP解释在模型调试和宇宙学科学发现中的实用性。代码可从https://github.com/BrachioLab/sop获取。