摘要
arXiv:2505.00023v1 Announce Type: cross
摘要:在真实的语料库中,知识在文档之间频繁重复出现,但由于命名模糊、信息过时或错误,常常包含不一致之处,导致上下文之间关系复杂。先前的研究表明,语言模型在处理这些复杂性方面存在困难,通常侧重于孤立的单一因素。我们将这些关系归类为四种类型:干扰性、含糊性、反事实性以及重复性。我们的分析表明,没有任何单一方法能够同时有效应对所有这些关系。因此,我们引入了一个名为Context Organizer(CORG)的框架,该框架将多个上下文组织成独立处理的组。这种设计允许模型高效地找到所有相关答案,同时确保消歧义。CORG包括三个关键组件:图构建器、再排序器和聚合器。我们的结果表明,CORG在性能和效率之间取得了良好的平衡,超越了现有的分组方法,并且在计算成本方面更少的单上下文方法中达到了相当的结果。