LLM2D

摘要

arXiv:2502.10725v3 宣告类型: replace-cross 摘要：基于Transformer的嵌入方法近年来在句子表示领域占据主导地位。尽管它们在NLP任务中，如语义文本相似性（STS）任务中取得了显著的性能，但它们的黑箱特性和依赖大量数据的训练方式引发了关于偏见、信任和安全性等方面的问题。已经做了许多努力来提高嵌入模型的可解释性，但这些问题并未从根本上解决。为了实现固有的可解释性，我们提出了一种纯粹的白盒且类人类的句子表示网络——PropNet。受到认知科学发现的启发，PropNet基于句子中包含的命题构建了一个层次化的网络结构。虽然实验表明，在STS任务中PropNet与最先进的（SOTA）嵌入模型相比存在显著差距，但案例研究揭示了显著的改进空间。此外，PropNet使我们能够分析和理解STS基准背后的认知过程。