摘要
arXiv:2502.10725v3 宣告类型: replace-cross
摘要:基于Transformer的嵌入方法近年来在句子表示领域占据主导地位。尽管它们在NLP任务中,如语义文本相似性(STS)任务中取得了显著的性能,但它们的黑箱特性和依赖大量数据的训练方式引发了关于偏见、信任和安全性等方面的问题。已经做了许多努力来提高嵌入模型的可解释性,但这些问题并未从根本上解决。为了实现固有的可解释性,我们提出了一种纯粹的白盒且类人类的句子表示网络——PropNet。受到认知科学发现的启发,PropNet基于句子中包含的命题构建了一个层次化的网络结构。虽然实验表明,在STS任务中PropNet与最先进的(SOTA)嵌入模型相比存在显著差距,但案例研究揭示了显著的改进空间。此外,PropNet使我们能够分析和理解STS基准背后的认知过程。