LLM2D
长上下文Really All You Need?利用LLM扩展上下文实现NL2SQL
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL
作者: Yeounoh Chung, Gaurav T. Kakkar, Yu Gan, Brenton Milne, Fatma Ozcan
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2501.12372v2

摘要

arXiv:2501.12372v2 宣告类型: replace-cross 摘要:大规模语言模型(LLMs)在一系列自然语言处理任务中展示了令人印象深刻的性能。特别是,推理能力的提升和上下文窗口的扩展为利用这些强大的模型开辟了新的途径。将自然语言转换为SQL(NL2SQL)具有挑战性,因为自然语言问题本质上是模糊的,而SQL生成则需要对复杂的数据模式和语义有精确的理解。解决这种语义模糊问题的一种方法是提供更多的上下文信息。 在本文中,我们研究了Google最新一代LLM(即gemini-1.5-pro)提供的扩展上下文窗口(所谓的长上下文)的性能和延迟折中。我们研究了包括列示例值、问题和SQL查询对、用户提供的提示、SQL文档和模式在内的各种上下文信息的影响。据我们所知,这是首项研究扩展上下文窗口和额外上下文信息如何有助于NL2SQL生成,对于准确性和延迟成本两者都有助益的工作。我们展示了长上下文LLMs是稳健的,并且不会迷失在扩展的上下文信息中。另外,我们基于Google的gemini-pro-1.5构建的长上下文NL2SQL流水线,在无需微调和昂贵的自我一致性方法的情况下,在各种基准数据集上取得了优异的性能。