LLM2D
隐私泄露在人工智能的视角下被忽视:关于语言模型代理中隐私的人工监督研究
Privacy Leakage Overshadowed by Views of AI: A Study on Human Oversight of Privacy in Language Model Agent
作者: Zhiping Zhang, Bingcan Guo, Tianshi Li
发布日期: 2/3/2025
arXiv ID: oai:arXiv.org:2411.01344v2

摘要

arXiv:2411.01344v2 代理类型: replace-cross 摘要:代理语言模型(LM)代理用户执行个人任务(例如回复邮件)可以提升生产力,但也容易受到无意的隐私泄露风险的影响。我们首次探讨了人们监督语言模型代理的隐私影响的能力。通过开展一项基于任务的调查(N=300),我们研究了当人们在异步人际通信任务中回应生成由LM代理生成的回应与他们自己写的回应时,他们的反应和评估情况。我们发现,人们可能会更倾向于那些含有更多隐私泄露的代理回应,或者认为两个回应都很好,这导致了有害信息披露增加了从15.7%到55.0%。我们进一步识别了六种不同的隐私概况,以描述人们在语言模型代理中的不同关注模式、信任水平和隐私偏好。我们的发现有助于设计能够促进隐私保护交互的代理系统,并实现双向对齐以帮助用户调整信任水平。