LLM2D
MAG-SQL:基于软模式链接和迭代子SQL细化的多智能体生成式文本到SQL方法
MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL
作者: Wenxuan Xie, Gaochen Wu, Bowen Zhou
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2408.07930v3

摘要

近年来,基于上下文学习的方法在文本到 SQL 任务中取得了显著成功。然而,这些模型在具有复杂数据库模式和困难问题的数据集(如 BIRD)上的表现与人类性能之间仍存在较大差距。此外,现有工作在使用问题分解方法迭代解决问题时,忽略了对中间步骤的监督,并且这些工作中使用的模式链接方法非常初级。为了解决这些问题,我们提出了 MAG-SQL,一种具有软模式链接和迭代子 SQL 细化的多代理生成方法。在我们的框架中,使用基于实体的方法和表格摘要来选择数据库中的列,并引入了一种新颖的目标条件分解方法来分解这些复杂的问题。此外,我们构建了一个迭代生成模块,其中包括子 SQL 生成器和子 SQL 细化器,为每个生成步骤引入外部监督。通过一系列消融研究,证明了我们框架中每个代理的有效性。在使用 GPT-4 对 BIRD 基准进行评估时,MAG-SQL 的执行准确率为 61.08%,而普通 GPT-4 的基准准确率为 46.35%,MAC-SQL 的基准准确率为 57.56%。此外,我们的方法在 Spider 上也取得了类似的进展。