LLM2D

摘要

arXiv:2502.06759v2 通知类型: replace-cross 摘要: 我们介绍了一个生成链式思维（Chain-of-Thought，CoT）推理论述的框架，以增强文本到SQL模型的微调。这些推理论述由中间的SQL语句和解释组成，作为构建最终SQL查询的逐步步骤。该过程始于手动标注一小组示例，然后使用这些示例以迭代和动态的少量演示知识精炼程序来引导一个大型语言模型从教师模型。随后，使用验证过的分解查询训练一个推理论证模型，从而为文本到SQL数据集生成大量的合成CoT注释。为了评估这种方法，我们使用带有和不带有这些推理论述的小型语言模型对BIRD数据集进行了微调。结果表明，逐步查询生成可以提高执行准确性，特别是在中等复杂度和高复杂度的查询方面，同时也能增强解释性。