LLM2D
SQL-o1:一种自我奖励启发式动态搜索方法用于文本到SQL
SQL-o1: A Self-Reward Heuristic Dynamic Search Method for Text-to-SQL
作者: Shuai Lyu, Haoran Luo, Zhonghong Ou, Yifan Zhu, Xiaoran Shang, Yang Qin, Meina Song
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11741v1

摘要

arXiv:2502.11741v1 声明类型: cross 摘要: Text-to-SQL(Text2SQL)任务旨在将自然语言查询转换为可执行的SQL查询。得益于大型语言模型(LLMs)的应用,该领域取得了显著进展。然而,SQL生成中的模型可扩展性、生成空间有限以及SQL生成中的连贯性问题等挑战仍然存在。为了解决这些问题,我们提出了一种名为SQL-o1的方法,这是一项基于自我奖励的启发式搜索方法,旨在增强LLMs在SQL查询生成中的推理能力。SQL-o1结合了蒙特卡洛树搜索(MCTS)以进行启发式过程级搜索,并构建了一个模式感知数据集,以帮助模型更好地理解数据库模式。在Bird和Spider数据集上的广泛实验表明,与最新的基线方法相比,SQL-o1在复杂Bird数据集上的执行准确性提高了10.8%,甚至超越了基于GPT-4的方法。此外,SQL-o1在少量示例学习场景中表现出色,并且具有很强的跨模型迁移能力。我们的代码在以下地址公开:https://github.com/ShuaiLyu0110/SQL-o1。