摘要
arXiv:2504.13717v1 交叉公告类型:跨学科
摘要:本文将深度学习(DL)与人类推理能力和需求相结合,以实现更具效率、可解释性和鲁棒性的图像分类。我们从三个角度进行探讨:可解释性、因果性和生物学视觉。在介绍背景和引言后,本工作将深入到具体的章节。首先,我们评估了神经网络在医学图像可视化技术的应用,并验证了一种设计可解释性的方法,用于乳腺肿块分类。接着,我们在可解释人工智能(XAI)与因果性交汇处进行了全面的综述,引入了一种通用框架来组织过去和未来的研究,为基础第二视角的探讨奠定基础。沿着因果性方向,我们提出了一种全新的模块,利用医学图像中特征共现现象,从而提高了预测的有效性和可解释性。我们还引入了一种名为CROCODILE的一般框架,整合了因果概念、对比学习、特征解耦和先验知识,以增强泛化能力。最后,我们探讨了生物学视觉,研究人类如何识别物体,并提出了CoCoReco网络,这是一种受连接启发且具有上下文感知注意机制的网络。总的来说,我们的关键发现包括:(i) 简单的激活最大化在医学成像DL模型中缺乏洞察力;(ii) 典型部分学习既有效又与放射学一致;(iii) 可解释AI和因果ML紧密相连;(iv) 无需先验信息即可利用弱因果信号来提高性能和可解释性;(v) 我们的框架在医学领域和离域数据上都能泛化;(vi) 采用生物电路模式可以改进与人类相一致的识别。本文为与人类相一致的DL提供了贡献,并强调了研究和临床应用之间的路径,这对提高信任度、诊断准确性以及安全部署具有重要意义。