LLM2D

摘要

arXiv:2504.12360v1 类型: cross 摘要：本文探讨了由不同于传统词向量空间（如doc2vec、GloVe等）的文档嵌入产生的负相似性导致的图谱聚类问题。讨论了组合Laplacian和规范化Laplacian的解决方案。实验研究表明，文献中提出以及在本研究中提出的不同解决方案各有优势和不足。研究展示了GloVe嵌入经常导致基于规范化Laplacian的图谱聚类出现问题，尤其是由于负相似性。此外，应用治愈相似性负性的方法可以提高基于组合Laplacian和规范化Laplacian的图谱聚类的准确性，并且可以使得原本为词向量空间嵌入开发的解释方法适用于GloVe嵌入。