LLM2D
知识图谱上的多样化自适应负采样
Diversified and Adaptive Negative Sampling on Knowledge Graphs
作者: Ran Liu, Zhongzhou Liu, Xiaoli Li, Hao Wu, Yuan Fang
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:2410.07592v1

摘要

在知识图谱嵌入中,除了用于训练的正三元组(即知识图谱中的事实)外,负三元组对模型性能也具有直接影响。现实中,由于知识图谱稀疏且不完整,负三元组通常缺乏明确的标签,因此通常通过各种采样策略(例如,随机替换正三元组中的实体)获得。理想的采样负三元组应该具有足够的 информативность,以帮助模型更好地训练。然而,现有方法在采样过程中往往忽略了多样性和自适应性,这会损害负三元组的 информативность。因此,我们提出了一种名为 DANS 的生成对抗方法,用于知识图谱上的多样化和自适应负采样。DANS 配备了一个双向生成器,通过两条路径生成更多样化的负三元组,以及一个自适应机制,通过对不同实体和关系进行全局生成器定位来生成更细粒度的示例。一方面,双向生成器通过更多样化的负面示例提高整体 информативность;另一方面,自适应机制通过更细粒度的采样提高单个样本的 информативность。最后,我们在三个基准知识图谱上评估了 DANS 的性能,通过定量和定性实验证明了其有效性。