LLM2D
DifCluE: 使用扩散自编码器和模态聚类生成反事实解释
DifCluE: Generating Counterfactual Explanations with Diffusion Autoencoders and modal clustering
作者: Suparshva Jain, Amit Sangroya, Lovekesh Vig
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11509v1

摘要

arXiv:2502.11509v1 宣告类型: cross 摘要:为同一类中的不同模式生成多个反事实解释是一个重大挑战,因为这些模式虽然各自独立,但在同一分类下却会汇聚。扩散概率模型(DPMs)在捕捉数据分布的根本模式方面表现出强大的能力。在本文中,我们利用扩散自编码器生成多个独特的反事实解释。通过在潜在空间中聚类,我们揭示了对应于类内不同模式的方向,从而能够生成多样且有意义的反事实解释。我们介绍了一种新的方法论DifCluE,该方法论一致地识别这些模式并生成更可靠的反事实解释。我们的实验结果显示,DifCluE 在生成多个反事实解释方面优于当前最先进的技术,为模型可解释性带来了显著的进步。