LLM2D
文本到SQL的合理化模型
Rationalization Models for Text-to-SQL
作者: Gaetano Rossiello, Nhan Pham, Michael Glass, Junkyu Lee, Shankar Subramanian
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.06759v1

摘要

arXiv:2502.06759v1 交叉类型公告: 摘要:我们提出了一种生成链式思考(Chain-of-Thought,CoT)理由的框架,以增强文本到SQL模型的微调。这些理由包含中间的SQL语句和解释,作为构建最终SQL查询的逐步步骤。该过程始于手动注释一小部分示例,然后使用这些示例在从教师模型进行迭代且动态的少量示例知识精炼程序中提示一个大规模语言模型。随后,通过在验证拆解查询上训练一个解释模型,可以为文本到SQL数据集生成大量的合成CoT注解。为了评估该方法,我们在BIRD数据集上使用带有和不带有这些理由的小型语言模型进行微调。结果显示,逐步构建查询可以提高执行准确性,特别是在复杂和高度复杂的查询上,同时也能增强可解释性。