LLM2D

摘要

大型语言模型（LLM）在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）中，现有的基于LLM的方法面临着知识编辑中的涟漪效应挑战。具体来说，当单个事实被编辑时，模型难以准确地更新序列中相关的其他事实，而这些事实通过多跳问题链接到一系列相关事实。最近的策略已从传统的参数更新转向更灵活、计算量更小的方法，这些方法已被证明在解决涟漪效应方面更有效。上下文学习（ICL）编辑使用简单的演示“想象一下 + 新事实”来引导LLM，但在处理复杂的多跳问题时却难以奏效，因为仅靠新事实无法指定这些场景中涉及的事实链。此外，基于记忆的编辑方法需要为所有编辑和相关事实维护额外的存储空间，这需要持续更新才能保持有效性。由于这些设计限制，该挑战仍然存在，在MQuAKE-cf基准测试中，Vicuna-7B的最高准确率仅为33.8%。为了解决这个问题，我们提出了RippleCOT，这是一种新颖的ICL编辑方法，它集成了思维链（COT）推理。RippleCOT将演示结构化为“新事实，问题，思考，答案”，并加入思考组件以识别和分解问题中的多跳逻辑。这种方法有效地引导模型通过包含一系列相关事实的复杂多跳问题。全面的实验表明，RippleCOT在涟漪效应方面显著优于现有技术，准确率提升了7.8%到87.1%。