摘要
arXiv:2412.02205v3 任务类型: replace-cross
摘要:商业智能(BI)通过将现代组织中的大量数据转化为有行动意义的见解,促进了基于信息的决策过程。最近,基于大型语言模型(LLM)的代理已经通过自动根据自然语言(NL)查询在可执行环境中执行任务规划、推理和操作,简化了BI工作流。然而,现有方法主要集中在诸如NL2SQL和NL2VIS等个别BI任务上。由于BI的迭代和协作性质,不同数据角色和工具之间的任务碎片化导致了效率低下和潜在错误。在本文中,我们介绍了DataLab,这是一个结合了一站式LLM代理框架和增强计算笔记本界面的统一BI平台。DataLab通过无缝结合LLM辅助和用户自定义,在单一环境中支持为不同数据角色在数据准备、分析和可视化中的各种BI任务。为了实现这一统一,我们设计了一个针对企业特定BI任务的领域知识整合模块,一个跨代理通信机制以促进BI工作流中的信息共享,以及一个基于单元格的上下文管理策略以提高BI笔记本中的上下文利用效率。广泛的实验表明,DataLab在流行的BI研究基准上的各种BI任务上达到了最先进的性能。此外,DataLab在来自腾讯的实际数据集上保持了高效率和有效性,针对企业特定的BI任务,其准确率提高了58.58%,令牌成本减少了61.65%。