LLM2D
数据治疗师:使用大型语言模型从领域专家处提取专业知识
Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models
作者: Sungbok Shin, Hyeon Jeon, Sanghyun Hong, Niklas Elmqvist
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2505.00455v2

摘要

arXiv:2505.00455v2 通告类型: 替换-交叉 摘要:有效的数据可视化不仅需要技术熟练度,还需要对数据存在的领域特定上下文有深刻理解。这种上下文通常包括关于数据来源、质量和预期用途的隐性知识,而这些知识在数据集本身中往往很少明确表达。我们介绍了一种名为“数据治疗师”的基于Web工具,它通过结合迭代问答和交互式注释的过程帮助领域专家将这种隐性知识外显化。该系统以大型语言模型为动力,分析用户提供的数据集,向用户提供针对性的问题提示,并允许不同粒度级别的注释。由此产生的结构化知识库可以指导人类和自动化的可视化设计。我们在涉及分子生物学、会计学、政治科学和可用安全性领域的专家配对参与的定性研究中评估了该工具。研究揭示了专家如何推理数据的反复出现的模式,并指出了AI支持可以改进可视化设计的领域。