LLM2D

摘要

arXiv:2504.13717v1 交叉公告类型：跨学科摘要：本文将深度学习（DL）与人类推理能力和需求相结合，以实现更具效率、可解释性和鲁棒性的图像分类。我们从三个角度进行探讨：可解释性、因果性和生物学视觉。在介绍背景和引言后，本工作将深入到具体的章节。首先，我们评估了神经网络在医学图像可视化技术的应用，并验证了一种设计可解释性的方法，用于乳腺肿块分类。接着，我们在可解释人工智能（XAI）与因果性交汇处进行了全面的综述，引入了一种通用框架来组织过去和未来的研究，为基础第二视角的探讨奠定基础。沿着因果性方向，我们提出了一种全新的模块，利用医学图像中特征共现现象，从而提高了预测的有效性和可解释性。我们还引入了一种名为CROCODILE的一般框架，整合了因果概念、对比学习、特征解耦和先验知识，以增强泛化能力。最后，我们探讨了生物学视觉，研究人类如何识别物体，并提出了CoCoReco网络，这是一种受连接启发且具有上下文感知注意机制的网络。总的来说，我们的关键发现包括：(i) 简单的激活最大化在医学成像DL模型中缺乏洞察力；(ii) 典型部分学习既有效又与放射学一致；(iii) 可解释AI和因果ML紧密相连；(iv) 无需先验信息即可利用弱因果信号来提高性能和可解释性；(v) 我们的框架在医学领域和离域数据上都能泛化；(vi) 采用生物电路模式可以改进与人类相一致的识别。本文为与人类相一致的DL提供了贡献，并强调了研究和临床应用之间的路径，这对提高信任度、诊断准确性以及安全部署具有重要意义。