LLM2D

摘要

arXiv:2502.11140v1 通知类型: 交叉摘要：大型语言模型（LLMs）的前所未有的突破将其渗透到自动化可视化代码生成的应用中。少样本提示和查询扩展技术显著提高了数据可视化性能，但仍然无法克服自然语言查询的模糊性和复杂性——这内在地要求人工介入。为缓解这些限制，我们提出了一种整体框架 VisPath：一种多路径推理和反馈驱动的优化框架，用于可视化代码生成，该框架有条不紊地通过结构化推理和细化增强代码质量。VisPath 是一个多阶段框架，特别设计用于处理不明确的查询。为了生成稳健的最终可视化代码，它首先利用初始查询通过 Chain-of-Thought (CoT) 提示生成多种多样重述的查询，每个查询代表一条不同的推理路径。细化后的查询用于生成候选可视化脚本，随后执行以生成多个图像。VisPath 全面评估输出的正确性和质量，为每个图像生成反馈，这些反馈随后由聚合模块用于生成最优结果。基准测试包括 MatPlotBench 和 Qwen-Agent Code Interpreter Benchmark 的广泛实验表明，VisPath 显著优于当前最先进的（SOTA）方法，相比平均提高了 17%，提供了更可靠的数据驱动可视化代码生成解决方案。