摘要
arXiv:2411.08599v3 宣言类型: 替换
摘要: 为了解决大规模语言模型在自然语言到SQL任务中的表现挑战,我们介绍了XiYan-SQL,这是一种创新框架,采用多生成器集成策略以提高候选生成的性能。我们提出了M-Schema,这是一种半结构化的模式表示方法,旨在增强对数据库结构的理解。为了提高生成的候选SQL查询的质量和多样性,XiYan-SQL将上下文学习(ICL)的重要潜力与监督微调的精确控制结合在一起。一方面,我们提出了一系列训练策略,以微调模型生成高质量、多样性的候选。另一方面,我们使用基于命名实体识别的示例选择方法实施了ICL方法,以防止过度强调实体。优化器通过纠正逻辑或语法错误来优化每个候选。为了应对最佳候选识别的挑战,我们微调了一个选择模型来区分候选SQL查询的细微差别。在多个方言数据集上的实验结果展示出XiYan-SQL在不同场景中应对挑战的鲁棒性。总体而言,我们提出的方法在Bird基准上实现了75.63%的最优执行准确率,在Spider测试集上实现了89.65%的准确率,在SQL-Eval上实现了69.86%的准确率,在NL2GQL上实现了41.20%的准确率。所提出的框架不仅提高了SQL查询的质量和多样性,而且在性能上超过了之前的方法。