摘要
arXiv:2503.23886v1 声明类型: cross
摘要:关系数据库设计会根据用户的要求生成一个模式,该模式定义了表结构及其相关的联系。将需求转化为准确的模式涉及多个非平凡的子任务,需要数据库专业知识和特定领域的知识。这对于自动化关系数据库设计提出了独特的挑战。现有的努力主要基于定制的规则或传统的深度学习模型,通常会产生次优的模式。最近,大型语言模型(LLMs)在各个领域智能应用开发方面取得了显著的进步。在本文中,我们提出了一种名为 SchemaAgent 的统一多智能体框架,用于自动生成高质量的数据库模式。SchemaAgent 是第一次使用大型语言模型进行模式生成,通过为智能体分配特定的角色并使其有效协作以完善各自的子任务,模拟手工模式设计的工作流程。模式生成是一个简化的流程框架,直接应用多智能体框架可能会导致错误累积的影响。为了解决这个问题,我们引入了专门的反思和检查角色,并结合了一种创新的错误检测和纠正机制,以识别并纠正各个阶段的问题。为了评估,我们引入了一个名为 \textit{RSchema} 的基准数据集,包含超过 500 对需求描述和模式。在该基准数据集上的实验结果表明,我们的方法在关系数据库模式生成方面优于主流的大型语言模型。