LLM2D
CrackSQL: 由大型语言模型驱动的混合SQL方言翻译系统
CrackSQL: A Hybrid SQL Dialect Translation System Powered by Large Language Models
作者: Wei Zhou, Yuyang Gao, Xuanhe Zhou, Guoliang Li
发布日期: 4/2/2025
arXiv ID: oai:arXiv.org:2504.00882v1

摘要

arXiv:2504.00882v1 Announce Type: 多方言 摘要:方言翻译在跨异构数据库系统实现无缝交互中扮演着关键角色。然而,由于语法差异和细微的语义变化,不同方言之间(例如,从 PostgreSQL 到 MySQL)的 SQL 查询翻译仍然是一个具有挑战性的任务。现有的方法,包括手动重写、基于规则的系统和基于大型语言模型(LLM)的技术,往往涉及高维护努力(例如,制定定制的翻译规则)或产生不可靠的结果(例如,LLM 生成不存在的功能),尤其是在处理复杂查询时。在这次演示中,我们介绍了 CrackSQL,这是一种结合规则和基于LLM方法的首个混合 SQL 方言翻译系统,以克服这些限制。CrackSQL 利用 LLM 的适应性来减少手动干预,同时通过基于功能的查询处理对长且复杂的 SQL 进行分割,从而提高翻译准确性。为进一步提高鲁棒性,它引入了一种新颖的跨方言语法嵌入模型,用于精确的语法对齐,以及一种有效的解决相互依赖查询操作的自适应局部到全局翻译策略。CrackSQL 支持三种翻译模式,并提供多种部署和访问选项,包括 Web 控制台接口、PyPI 包和命令行提示,使得它能够在各种实际应用场景中得到采用。