LLM2D

摘要

arXiv:2310.16316v3 宣告类型: 替换-交叉摘要: 自归因神经网络（SANNs）为高维问题的可解释模型提供了潜在的道路，但往往在性能上面临显著的权衡。在本文中，我们正式证明了单特征SANNs的误差下界，而基于组的SANNs可以实现零误差，从而获得高性能。基于这些洞见，我们提出了Sum-of-Parts（SOP）框架，将任何可微模型转换为基于组的SANN，其中特征组通过端到端的学习学习，而不需组监督。SOP在视觉和语言任务中实现了SANNs的最优性能，并且我们通过一系列定量和语义指标验证了组的可解释性。我们进一步验证了SOP解释在模型调试和宇宙学科学发现中的实用性。代码可从https://github.com/BrachioLab/sop获取。