LLM2D

摘要

arXiv:2409.13684v1 公告类型: 交叉摘要: 基于特征的方法常用于解释模型预测，但这些方法通常隐含地假设可解释的特征是现成的。然而，对于高维数据，这往往并非如此，即使是领域专家也难以数学上明确哪些特征是重要的。我们能否自动提取与专家知识相一致的特征集合或特征组？为了填补这一空白，我们提出了FIX（面向专家的可解释特征），一个用于衡量特征集合与专家知识对齐程度的基准。在与领域专家的合作中，我们开发了跨多种现实场景的特征可解释性目标，并将它们统一到一个单一的框架中，即FIX基准。我们发现，流行的基于特征的解释方法与专家指定的知识对齐度较差，这突显了开发能够更好地识别专家可解释特征的新方法的必要性。