LLM2D

摘要

arXiv:2502.14913v1 宣告类型: cross 摘要：尽管多智能体协作大语言模型（LLMs）在Text-to-SQL任务中取得了显著突破，但其性能仍受到多种因素的限制。这些因素包括框架的不完备性、未能遵循指令以及模型的生成幻觉问题。为了解决这些问题，我们提出了OpenSearch-SQL，将Text-to-SQL任务划分为四个主要模块：预处理、提取、生成和精炼，并基于一致性对齐机制引入了对齐模块。该架构通过对齐模块将各智能体的输入和输出进行对齐，从而减少了指令遵循失败和生成幻觉的情况。此外，我们设计了一种中间语言称为SQL-Like，并基于SQL-Like优化了结构化CoT。同时，我们开发了一种动态少量示范策略，形式为自我学习的Query-CoT-SQL。这些方法显著提高了LLMs在Text-to-SQL任务上的性能。在模型选择方面，我们直接应用了基础LLMs，未进行任何后训练，从而简化了任务链并增强了框架的移植性。实验结果表明，OpenSearch-SQL在BIRD开发集上的执行准确率（EX）为69.3%，测试集上为72.28%，基于奖励的有效性效率分数（R-VES）为69.36%，三项指标提交时均排名第一。这些结果证明了所提出方法在有效性和效率方面的全面优势。