LLM2D
通过公理化因果干预解析神经检索模型中的多语言和文档长度敏感相关性计算
Interpreting Multilingual and Document-Length Sensitive Relevance Computations in Neural Retrieval Models through Axiomatic Causal Interventions
作者: Oliver Savolainen, Dur e Najaf Amjad, Roxana Petcu
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.02154v1

摘要

arXiv:2505.02154v1 交叉类型: 摘要:本再现性研究分析并扩展了论文《公理化因果干预在神经检索模型中反向工程相关性计算中的研究》,该论文探讨了神经检索模型如何编码与任务相关的特点,如词频。我们再现了原始论文中的关键实验,确认查询词的信息被模型编码所捕获。在此基础上,我们通过应用激活补丁到西班牙语和汉语数据集,并探索文字段落长度信息是否也被编码进模型。我们的结果显示,设计的激活补丁方法能够将模型的行为隔离到特定组件和标记中。此外,我们的研究发现词频的位置在不同语言中具有普适性,并且在后期层中,序列级任务的信息在CLS标记中有所体现。研究结果突显了在信息检索中增强可解释性以及在机器学习研究中保持可重现性的进一步研究需求。我们的代码可在https://github.com/OliverSavolainen/axiomatic-ir-reproduce获取。