LLM2D

摘要

arXiv:2503.23886v1 声明类型: cross 摘要：关系数据库设计会根据用户的要求生成一个模式，该模式定义了表结构及其相关的联系。将需求转化为准确的模式涉及多个非平凡的子任务，需要数据库专业知识和特定领域的知识。这对于自动化关系数据库设计提出了独特的挑战。现有的努力主要基于定制的规则或传统的深度学习模型，通常会产生次优的模式。最近，大型语言模型（LLMs）在各个领域智能应用开发方面取得了显著的进步。在本文中，我们提出了一种名为 SchemaAgent 的统一多智能体框架，用于自动生成高质量的数据库模式。SchemaAgent 是第一次使用大型语言模型进行模式生成，通过为智能体分配特定的角色并使其有效协作以完善各自的子任务，模拟手工模式设计的工作流程。模式生成是一个简化的流程框架，直接应用多智能体框架可能会导致错误累积的影响。为了解决这个问题，我们引入了专门的反思和检查角色，并结合了一种创新的错误检测和纠正机制，以识别并纠正各个阶段的问题。为了评估，我们引入了一个名为 \textit{RSchema} 的基准数据集，包含超过 500 对需求描述和模式。在该基准数据集上的实验结果表明，我们的方法在关系数据库模式生成方面优于主流的大型语言模型。