LLM2D

摘要

arXiv:2504.09961v1 类型：跨领域摘要：随着大型语言模型（LLMs）在科学工作流中的逐渐普及，人们对保密数据的保密性和伦理处理问题的担忧也随之增加。本文探讨了通过LLM支持的科学工具的数据外泄风险，这些工具可能会无意中泄露科学家的知识产权、专有数据等敏感信息。我们提出了一种名为“DataShield”的框架，旨在检测敏感数据外泄、总结隐私政策并可视化数据流，从而确保与组织政策和程序的契合。我们的方法旨在向科学家提供数据处理实践的信息，使他们能够做出知情决策并保护敏感信息。目前正在对科学家进行持续的用户研究，以评估该框架的易用性、可信度及其在应对实际隐私挑战方面的有效性。