LLM2D

摘要

arXiv:2502.11741v1 声明类型: cross 摘要: Text-to-SQL（Text2SQL）任务旨在将自然语言查询转换为可执行的SQL查询。得益于大型语言模型（LLMs）的应用，该领域取得了显著进展。然而，SQL生成中的模型可扩展性、生成空间有限以及SQL生成中的连贯性问题等挑战仍然存在。为了解决这些问题，我们提出了一种名为SQL-o1的方法，这是一项基于自我奖励的启发式搜索方法，旨在增强LLMs在SQL查询生成中的推理能力。SQL-o1结合了蒙特卡洛树搜索（MCTS）以进行启发式过程级搜索，并构建了一个模式感知数据集，以帮助模型更好地理解数据库模式。在Bird和Spider数据集上的广泛实验表明，与最新的基线方法相比，SQL-o1在复杂Bird数据集上的执行准确性提高了10.8%，甚至超越了基于GPT-4的方法。此外，SQL-o1在少量示例学习场景中表现出色，并且具有很强的跨模型迁移能力。我们的代码在以下地址公开：https://github.com/ShuaiLyu0110/SQL-o1。