LLM2D

摘要

arXiv:2504.09095v1 交叉学科类型：其他摘要：机器理解并生成类似于人类语言的能力，得益于自然语言处理（NLP）的快速发展，这些进展是由生成性人工智能（AI）和大型语言模型（LLMs）推动的，从而彻底改变了客户服务、医疗保健和金融等领域。然而，由于大型数据集训练的LLMs可能会无意中吸收和泄露用户互动中的个人信息（PII），这些能力也引发了严重的隐私问题。深度神经网络的复杂性使得追踪或阻止无意中存储和释放私人信息变得困难，这引发了对基于AI的数据的隐私和安全性的严重关切。本文通过数据提取、模型逆向工程和成员身份推断等攻击手段来检测生成性AI的弱点，从而应对这些挑战。然后开发了一种隐私保护的生成性AI应用程序，能够在处理LLMs之前识别、修改或移除PII，以确保隐私的同时不牺牲功能。此外，研究还考察了诸如Microsoft Azure、Google Cloud和AWS等云平台提供的隐私工具，以保护AI应用程序的能力。最终，本文为生成性AI系统提供了一个基本的隐私范式，重点关注数据安全和道德AI的实施，为更安全和负责任地使用这些工具打开了大门。