摘要
arXiv:2410.12537v2 任务类型: replace-cross
摘要:复杂查询回答(CQA)在知识图谱(KGs)上的研究正在成为一个具有挑战性的推理任务。在本文中,我们展示了现有的CQA基准可能不像我们想象的那样复杂,因为它们的构建方式扭曲了我们在该领域取得进展的感知。例如,我们发现,在这些基准中,大多数查询(某些查询类型的查询多达98%)可以简化为更简单的问题,例如链接预测,其中只需要预测一个链接。当使用这些无法简化为更简单类型的问题评估最先进的CQA模型时,这些模型的表现会显著下降。因此,我们提出了一组更具挑战性的基准,由需要模型在多个跳跃中推理且更好地反映真实世界KG构建的查询组成。在系统的实证研究中,新的基准表明,当前的方法远未达到当前CQA方法的效果。