LLM2D

摘要

arXiv:2411.08599v3 宣言类型: 替换摘要: 为了解决大规模语言模型在自然语言到SQL任务中的表现挑战，我们介绍了XiYan-SQL，这是一种创新框架，采用多生成器集成策略以提高候选生成的性能。我们提出了M-Schema，这是一种半结构化的模式表示方法，旨在增强对数据库结构的理解。为了提高生成的候选SQL查询的质量和多样性，XiYan-SQL将上下文学习（ICL）的重要潜力与监督微调的精确控制结合在一起。一方面，我们提出了一系列训练策略，以微调模型生成高质量、多样性的候选。另一方面，我们使用基于命名实体识别的示例选择方法实施了ICL方法，以防止过度强调实体。优化器通过纠正逻辑或语法错误来优化每个候选。为了应对最佳候选识别的挑战，我们微调了一个选择模型来区分候选SQL查询的细微差别。在多个方言数据集上的实验结果展示出XiYan-SQL在不同场景中应对挑战的鲁棒性。总体而言，我们提出的方法在Bird基准上实现了75.63%的最优执行准确率，在Spider测试集上实现了89.65%的准确率，在SQL-Eval上实现了69.86%的准确率，在NL2GQL上实现了41.20%的准确率。所提出的框架不仅提高了SQL查询的质量和多样性，而且在性能上超过了之前的方法。