LLM2D
部分求和:具有端到端特征组学习的自 attribution 神经网络
Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups
作者: Weiqiu You, Helen Qu, Marco Gatti, Bhuvnesh Jain, Eric Wong
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2310.16316v3

摘要

arXiv:2310.16316v3 宣告类型: 替换-交叉 摘要: 自归因神经网络(SANNs)为高维问题的可解释模型提供了潜在的道路,但往往在性能上面临显著的权衡。在本文中,我们正式证明了单特征SANNs的误差下界,而基于组的SANNs可以实现零误差,从而获得高性能。基于这些洞见,我们提出了Sum-of-Parts(SOP)框架,将任何可微模型转换为基于组的SANN,其中特征组通过端到端的学习学习,而不需组监督。SOP在视觉和语言任务中实现了SANNs的最优性能,并且我们通过一系列定量和语义指标验证了组的可解释性。我们进一步验证了SOP解释在模型调试和宇宙学科学发现中的实用性。代码可从https://github.com/BrachioLab/sop获取。