摘要
arXiv:2502.11741v1 声明类型: cross
摘要: Text-to-SQL(Text2SQL)任务旨在将自然语言查询转换为可执行的SQL查询。得益于大型语言模型(LLMs)的应用,该领域取得了显著进展。然而,SQL生成中的模型可扩展性、生成空间有限以及SQL生成中的连贯性问题等挑战仍然存在。为了解决这些问题,我们提出了一种名为SQL-o1的方法,这是一项基于自我奖励的启发式搜索方法,旨在增强LLMs在SQL查询生成中的推理能力。SQL-o1结合了蒙特卡洛树搜索(MCTS)以进行启发式过程级搜索,并构建了一个模式感知数据集,以帮助模型更好地理解数据库模式。在Bird和Spider数据集上的广泛实验表明,与最新的基线方法相比,SQL-o1在复杂Bird数据集上的执行准确性提高了10.8%,甚至超越了基于GPT-4的方法。此外,SQL-o1在少量示例学习场景中表现出色,并且具有很强的跨模型迁移能力。我们的代码在以下地址公开:https://github.com/ShuaiLyu0110/SQL-o1。