LLM2D
隐私遇上了可解释性:在以大语言模型赋能的科学中管理保密数据和透明政策
Privacy Meets Explainability: Managing Confidential Data and Transparency Policies in LLM-Empowered Science
作者: Yashothara Shanmugarasa, Shidong Pan, Ming Ding, Dehai Zhao, Thierry Rakotoarivelo
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.09961v1

摘要

arXiv:2504.09961v1 类型:跨领域 摘要:随着大型语言模型(LLMs)在科学工作流中的逐渐普及,人们对保密数据的保密性和伦理处理问题的担忧也随之增加。本文探讨了通过LLM支持的科学工具的数据外泄风险,这些工具可能会无意中泄露科学家的知识产权、专有数据等敏感信息。我们提出了一种名为“DataShield”的框架,旨在检测敏感数据外泄、总结隐私政策并可视化数据流,从而确保与组织政策和程序的契合。我们的方法旨在向科学家提供数据处理实践的信息,使他们能够做出知情决策并保护敏感信息。目前正在对科学家进行持续的用户研究,以评估该框架的易用性、可信度及其在应对实际隐私挑战方面的有效性。