LLM2D

摘要

arXiv:2504.04717v2 公告类型：替换交叉摘要：大型语言模型（LLMs）最近的进步已经彻底改变了它们处理单轮任务的能力，但在实际应用中，仍然需要复杂的多轮交互。本文综述了最近在评估和增强LLMs多轮交互方面的进展。本文着眼于特定任务场景，从数学和编程等多种领域中的指令跟随，到在角色扮演、医疗保健、教育，甚至对抗性越狱设置中的复杂对话互动，我们系统地考察了在长时间对话中保持情境、连贯性、公正性和响应性的挑战。本文将现有的基准测试和数据集组织成反映多轮对话评估演化的连贯类别。此外，我们还回顾了多轮场景下的多种增强方法，包括基于模型的策略（上下文学习、监督微调、强化学习和新型架构）、外部整合方法（增强记忆的、检索为基础的方法和知识图谱）以及基于代理的技术，用于协作交互。最后，我们讨论了开放性挑战，并提出未来研究方向，以进一步提高多轮交互在LLMs中的稳健性和有效性。相关资源和论文可在https://github.com/yubol-cmu/Awesome-Multi-Turn-LLMs找到。