LLM2D

摘要

在知识图谱嵌入中，除了用于训练的正三元组（即知识图谱中的事实）外，负三元组对模型性能也具有直接影响。现实中，由于知识图谱稀疏且不完整，负三元组通常缺乏明确的标签，因此通常通过各种采样策略（例如，随机替换正三元组中的实体）获得。理想的采样负三元组应该具有足够的 информативность，以帮助模型更好地训练。然而，现有方法在采样过程中往往忽略了多样性和自适应性，这会损害负三元组的 информативность。因此，我们提出了一种名为 DANS 的生成对抗方法，用于知识图谱上的多样化和自适应负采样。DANS 配备了一个双向生成器，通过两条路径生成更多样化的负三元组，以及一个自适应机制，通过对不同实体和关系进行全局生成器定位来生成更细粒度的示例。一方面，双向生成器通过更多样化的负面示例提高整体 информативность；另一方面，自适应机制通过更细粒度的采样提高单个样本的 информативность。最后，我们在三个基准知识图谱上评估了 DANS 的性能，通过定量和定性实验证明了其有效性。