摘要
arXiv:2505.07064v1 Announce Type: cross
摘要:虽然像ParaView这样的工具功能强大且已得到广泛认可,但它们的学习曲线陡峭,令许多潜在用户望而却步。本文介绍了ParaView-MCP,这是一种自主代理,将现代化的多模态大型语言模型(MLLM)与ParaView集成,不仅降低了入门门槛,还增强了ParaView的智能决策支持功能。通过利用MLLM最先进的推理、命令执行和视觉能力,ParaView-MCP使用户能够通过自然语言和视觉输入与ParaView进行交互。具体而言,我们的系统采用了模型应用通信的标准接口——Model Context Protocol (MCP),这使得MLLM可以直接与ParaView的Python API进行交互,从而在用户、语言模型和可视化工具之间实现无缝信息交换。此外,通过实现一个视觉反馈机制,让代理能够观察视窗,我们解锁了一系列新的功能,包括根据示例重现可视化、基于用户定义的目标进行闭环可视化参数更新,甚至涉及多个工具的跨应用程序协作。总的来说,我们认为这种由代理驱动的可视化范式可以深刻改变我们与可视化工具的交互方式。我们预计这种可视化工具的发展将在可视化研究和工业中获得显著增长。