摘要
arXiv:2502.11201v1 类别: cross
摘要: 由于 NoSQL 数据库在处理大规模、非结构化和半结构化数据方面表现出色,它们越来越受欢迎,这突显了需要用户友好的界面来弥合非技术人员与复杂数据库查询之间的差距。在本文中,我们介绍了文本到 NoSQL 任务,旨在将自然语言查询转换为 NoSQL 查询,从而降低非专家用户的技术门槛。为了促进该领域的研究,我们开发了一种新颖的自动化数据集构建过程,并发布了该任务的大规模开源数据集,命名为 TEND(即 Text-to-NoSQL 数据集)。此外,我们设计了一种特定于文本到 NoSQL 转换的小语言模型辅助和检索增强生成辅助多步框架,称为 SMART。为了确保对模型进行全面评估,我们还引入了一套详细的度量标准,从查询本身及其执行结果两个方面评估模型的性能。我们的实验结果证明了我们方法的有效性,并为这一新兴领域的未来研究建立了一个基准。我们认为,我们的贡献将为 NoSQL 数据库的更易于使用的直观交互铺平道路。