LLM2D
FIX基准:提取对专家可解释的特征
The FIX Benchmark: Extracting Features Interpretable to eXperts
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13684v1

摘要

arXiv:2409.13684v1 公告类型: 交叉 摘要: 基于特征的方法常用于解释模型预测,但这些方法通常隐含地假设可解释的特征是现成的。然而,对于高维数据,这往往并非如此,即使是领域专家也难以数学上明确哪些特征是重要的。我们能否自动提取与专家知识相一致的特征集合或特征组?为了填补这一空白,我们提出了FIX(面向专家的可解释特征),一个用于衡量特征集合与专家知识对齐程度的基准。在与领域专家的合作中,我们开发了跨多种现实场景的特征可解释性目标,并将它们统一到一个单一的框架中,即FIX基准。我们发现,流行的基于特征的解释方法与专家指定的知识对齐度较差,这突显了开发能够更好地识别专家可解释特征的新方法的必要性。