LLM2D

摘要

arXiv:2505.00023v1 Announce Type: cross 摘要：在真实的语料库中，知识在文档之间频繁重复出现，但由于命名模糊、信息过时或错误，常常包含不一致之处，导致上下文之间关系复杂。先前的研究表明，语言模型在处理这些复杂性方面存在困难，通常侧重于孤立的单一因素。我们将这些关系归类为四种类型：干扰性、含糊性、反事实性以及重复性。我们的分析表明，没有任何单一方法能够同时有效应对所有这些关系。因此，我们引入了一个名为Context Organizer（CORG）的框架，该框架将多个上下文组织成独立处理的组。这种设计允许模型高效地找到所有相关答案，同时确保消歧义。CORG包括三个关键组件：图构建器、再排序器和聚合器。我们的结果表明，CORG在性能和效率之间取得了良好的平衡，超越了现有的分组方法，并且在计算成本方面更少的单上下文方法中达到了相当的结果。