摘要
arXiv:2503.22402v1 宣告类型: cross
摘要: Text-to-SQL 自动将自然语言查询翻译成 SQL,从而允许非技术人员在无需专门 SQL 知识的情况下从数据库中检索数据。尽管基于先进语言模型 (LLM) 的 Text-to-SQL 方法在排行榜上取得了成功,但其不可持续的计算成本——往往被忽略——成为了当前排行榜驱动研究中的“房间里的大象”,限制了其在实际部署中的经济实用性以及广泛的采用。为了解决这个问题,我们提出了一个名为 EllieSQL 的复杂性感知路由框架,根据估计的复杂性将查询分配给合适的 SQL 生成管道。我们研究了多种路由方法,以将简单的查询导向高效的方法,并将计算密集型的方法保留给复杂的情况。借鉴经济学,我们引入了 Token 弹性绩效 (TEP) 指标,通过量化性能提升相对于 SQL 生成中 token 投资的响应性来衡量成本效率。实验表明,相比于在我们研究中始终使用最先进的方法,使用 Qwen2.5-0.5B-DPO 路由器的 EllieSQL 在 Bird 发展集上性能无任何损失的情况下,token 使用量减少了超过 40%,TEP 指标超过了没有路由方法的 2 倍以上。这不仅促进了成本效益型 Text-to-SQL 的发展,还邀请社区将资源效率与性能相结合,促进可持续 Text-to-SQL 的进展。