摘要
自大型语言模型 (LLM) 出现以来,将自然语言查询转换为结构化的 SQL 命令变得越来越重要。与之前的综述不同,本综述对基于 LLM 的文本到 SQL 系统的演变进行了全面研究,从早期的基于规则的模型到先进的 LLM 方法,以及 LLM 如何影响该领域。我们讨论了基准、评估方法和评估指标。此外,我们独特地研究了知识图谱集成在这些系统中提高上下文准确性和模式链接的作用。当前的技术分为两类:语料库的上下文学习和微调,这最终导致了零样本、少样本学习以及数据增强等方法。最后,我们强调了计算效率、模型鲁棒性和数据隐私等关键挑战,并从其发展和改进的角度展望了基于 LLM 的文本到 SQL 系统未来的潜在领域。