摘要
实体链接 (EL) 和关系抽取 (RE) 是自然语言处理中的基础任务,是广泛应用的关键组成部分。本文提出了一种用于 EL 和 RE 的检索器-阅读器架构 ReLiK,其中,给定输入文本,检索器模块负责识别文本中可能出现的候选实体或关系。随后,阅读器模块的任务是辨别相关的检索到的实体或关系,并将其与相应的文本片段对齐。值得注意的是,我们提出了一种创新的输入表示方法,该方法将候选实体或关系与文本一起纳入,从而能够在单次前向传递中链接实体或提取关系,并充分利用预训练语言模型的上下文理解能力,这与以往基于检索器-阅读器的其他方法(需要对每个候选进行一次前向传递)形成对比。我们的 EL 和 RE 方法在领域内和领域外基准测试中均取得了最先进的性能,同时使用了学术预算训练,推理速度比竞争对手快达 40 倍。最后,我们展示了如何将我们的架构无缝用于信息抽取 (cIE),即 EL + RE,并通过使用共享阅读器同时提取实体和关系来设定新的最先进水平。