LLM2D

摘要

大型语言模型 (LLMs) 在自然语言处理方面展现出非凡的能力；然而，当它们被要求理解长篇语境并执行有效的问答时，仍然面临困难。这些挑战通常是由于较长文本中存在的复杂性和歧义造成的。为了增强 LLMs 在此类场景下的性能，我们引入了长问句共指适应 (LQCA) 方法。这个创新框架侧重于针对长篇语境量身定制的共指消解，使模型能够有效地识别和管理引用。LQCA 方法包含四个关键步骤：在子文档中解决共指、计算提及之间的距离、为共指定义代表性提及以及通过提及替换来回答问题。通过系统地处理信息，该框架为 LLMs 提供了更容易处理的分割，促进了更好的理解。在各种 LLMs 和数据集上的实验评估产生了积极的结果，在 OpenAI-o1-mini 和 GPT-4o 模型上取得了显著的改进，突出了利用共指消解来弥合问答中语境差距的有效性。