LLM2D

摘要

arXiv:2410.12537v2 任务类型: replace-cross 摘要：复杂查询回答（CQA）在知识图谱（KGs）上的研究正在成为一个具有挑战性的推理任务。在本文中，我们展示了现有的CQA基准可能不像我们想象的那样复杂，因为它们的构建方式扭曲了我们在该领域取得进展的感知。例如，我们发现，在这些基准中，大多数查询（某些查询类型的查询多达98%）可以简化为更简单的问题，例如链接预测，其中只需要预测一个链接。当使用这些无法简化为更简单类型的问题评估最先进的CQA模型时，这些模型的表现会显著下降。因此，我们提出了一组更具挑战性的基准，由需要模型在多个跳跃中推理且更好地反映真实世界KG构建的查询组成。在系统的实证研究中，新的基准表明，当前的方法远未达到当前CQA方法的效果。