摘要
arXiv:2504.14038v1 类型: cross
摘要: 进行数据分析通常涉及编写代码以转换、可视化、分析和解释数据。如今,大型语言模型(LLMs)能够为简单的常规分析生成此类代码。LLMs有望通过使那些缺乏编程经验的人能够进行数据分析,从而民主化数据分析,包括在科学研究、商业和政策制定中。然而,在许多实际环境中,分析师往往需要对特定分析步骤进行精细控制,明确验证中间结果,并迭代改进他们的分析方法。这些任务构成了单独使用LLMs或与现有编写工具(例如计算笔记本)结合使用时构建稳健且可重复的分析的障碍。本文介绍了一种新的混合启动系统Flowco以应对这些挑战。Flowco利用了视觉数据流编程模型,并将LLMs集成到编写过程的每一阶段。一项用户研究表明,Flowco能够支持分析师,特别是那些编程经验较少的分析师,快速编写、调试和改进数据分析。