摘要
arXiv:2504.09961v1 类型:跨领域
摘要:随着大型语言模型(LLMs)在科学工作流中的逐渐普及,人们对保密数据的保密性和伦理处理问题的担忧也随之增加。本文探讨了通过LLM支持的科学工具的数据外泄风险,这些工具可能会无意中泄露科学家的知识产权、专有数据等敏感信息。我们提出了一种名为“DataShield”的框架,旨在检测敏感数据外泄、总结隐私政策并可视化数据流,从而确保与组织政策和程序的契合。我们的方法旨在向科学家提供数据处理实践的信息,使他们能够做出知情决策并保护敏感信息。目前正在对科学家进行持续的用户研究,以评估该框架的易用性、可信度及其在应对实际隐私挑战方面的有效性。