摘要
arXiv:2502.14913v1 宣告类型: cross
摘要:尽管多智能体协作大语言模型(LLMs)在Text-to-SQL任务中取得了显著突破,但其性能仍受到多种因素的限制。这些因素包括框架的不完备性、未能遵循指令以及模型的生成幻觉问题。为了解决这些问题,我们提出了OpenSearch-SQL,将Text-to-SQL任务划分为四个主要模块:预处理、提取、生成和精炼,并基于一致性对齐机制引入了对齐模块。该架构通过对齐模块将各智能体的输入和输出进行对齐,从而减少了指令遵循失败和生成幻觉的情况。此外,我们设计了一种中间语言称为SQL-Like,并基于SQL-Like优化了结构化CoT。同时,我们开发了一种动态少量示范策略,形式为自我学习的Query-CoT-SQL。这些方法显著提高了LLMs在Text-to-SQL任务上的性能。
在模型选择方面,我们直接应用了基础LLMs,未进行任何后训练,从而简化了任务链并增强了框架的移植性。实验结果表明,OpenSearch-SQL在BIRD开发集上的执行准确率(EX)为69.3%,测试集上为72.28%,基于奖励的有效性效率分数(R-VES)为69.36%,三项指标提交时均排名第一。这些结果证明了所提出方法在有效性和效率方面的全面优势。