摘要
我们提出了一种名为 CQG 的生成式方法,利用神经网络和 WordNet 从给定文章中构建完形填空题,重点是生成多词干扰项。CQG 基于词义消歧、文本到文本转换、WordNet 的同义词集分类和词汇标签,为给定句子选择一个答案键,将其分割成一系列实例,使用 Transformer 和同级同义词集生成实例级干扰项候选 (IDC)。然后,它会删除不合适的 IDC,根据上下文嵌入相似性以及同义词集和词汇相关性对剩余的 IDC 进行排序,通过组合地用相应的排名前列的 IDC 替换实例来形成干扰项候选,并检查它们是否为合法的短语。最后,它根据与答案键的上下文语义相似性选择排名前列的干扰项候选。实验表明,该方法明显优于最先进的结果。人工评判也证实了生成的干扰项的高质量。