LLM2D

摘要

arXiv:2502.11509v1 宣告类型: cross 摘要：为同一类中的不同模式生成多个反事实解释是一个重大挑战，因为这些模式虽然各自独立，但在同一分类下却会汇聚。扩散概率模型（DPMs）在捕捉数据分布的根本模式方面表现出强大的能力。在本文中，我们利用扩散自编码器生成多个独特的反事实解释。通过在潜在空间中聚类，我们揭示了对应于类内不同模式的方向，从而能够生成多样且有意义的反事实解释。我们介绍了一种新的方法论DifCluE，该方法论一致地识别这些模式并生成更可靠的反事实解释。我们的实验结果显示，DifCluE 在生成多个反事实解释方面优于当前最先进的技术，为模型可解释性带来了显著的进步。