LLM2D
面向特征的表示与聚类解释
FORCE: Feature-Oriented Representation with Clustering and Explanation
作者: Rishav Mukherjee, Jeffrey Ahearn Thompson
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2504.05530v1

摘要

arXiv:2504.05530v1 声明类型:交叉 摘要:利用潜在未观察到的结构来学习数据中的潜在模式,以提高预测模型的准确性,已成为深度学习研究的一个活跃领域。大多数方法将原始特征聚类以捕获某些潜在结构。然而,在该过程中获得的信息往往可以通过足够复杂的模型隐式推导出来。因此,这些方法通常提供的益处有限。我们提出了一种基于 SHAP(Shapley Additive exPlanations)的监督深度学习框架 FORCE,该框架在神经网络架构中采用了两阶段使用 SHAP 值的方法,(i) 基于聚类 SHAP 值的额外潜在特征,以指导模型训练,(ii) 使用潜在信息在架构内启动注意机制。这种方法让神经网络了解未观察值对特征重要性的影响。我们提出的方法在三个实际数据集上进行了评估。结果显示,与未结合潜在特征和注意框架的网络(例如,心肌梗死存在情况下的 F1 分数为 0.80 对比 0.72)相比,FORCE 在整体性能上取得了显著的提升。使用聚类分配和基于 SHAP 值的注意力机制指导深度学习,增强了潜在模式的学习能力和整体的分类能力。