LLM2D
VisPath:多路径推理与反馈驱动优化的自动化可视化代码合成
VisPath: Automated Visualization Code Synthesis via Multi-Path Reasoning and Feedback-Driven Optimization
作者: Wonduk Seo, Seungyong Lee, Daye Kang, Zonghao Yuan, Seunghyun Lee
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11140v1

摘要

arXiv:2502.11140v1 通知类型: 交叉 摘要:大型语言模型(LLMs)的前所未有的突破将其渗透到自动化可视化代码生成的应用中。少样本提示和查询扩展技术显著提高了数据可视化性能,但仍然无法克服自然语言查询的模糊性和复杂性——这内在地要求人工介入。为缓解这些限制,我们提出了一种整体框架 VisPath:一种多路径推理和反馈驱动的优化框架,用于可视化代码生成,该框架有条不紊地通过结构化推理和细化增强代码质量。VisPath 是一个多阶段框架,特别设计用于处理不明确的查询。为了生成稳健的最终可视化代码,它首先利用初始查询通过 Chain-of-Thought (CoT) 提示生成多种多样重述的查询,每个查询代表一条不同的推理路径。细化后的查询用于生成候选可视化脚本,随后执行以生成多个图像。VisPath 全面评估输出的正确性和质量,为每个图像生成反馈,这些反馈随后由聚合模块用于生成最优结果。基准测试包括 MatPlotBench 和 Qwen-Agent Code Interpreter Benchmark 的广泛实验表明,VisPath 显著优于当前最先进的(SOTA)方法,相比平均提高了 17%,提供了更可靠的数据驱动可视化代码生成解决方案。