LLM2D

摘要

arXiv:2411.01344v2 代理类型: replace-cross 摘要：代理语言模型（LM）代理用户执行个人任务（例如回复邮件）可以提升生产力，但也容易受到无意的隐私泄露风险的影响。我们首次探讨了人们监督语言模型代理的隐私影响的能力。通过开展一项基于任务的调查（N=300），我们研究了当人们在异步人际通信任务中回应生成由LM代理生成的回应与他们自己写的回应时，他们的反应和评估情况。我们发现，人们可能会更倾向于那些含有更多隐私泄露的代理回应，或者认为两个回应都很好，这导致了有害信息披露增加了从15.7%到55.0%。我们进一步识别了六种不同的隐私概况，以描述人们在语言模型代理中的不同关注模式、信任水平和隐私偏好。我们的发现有助于设计能够促进隐私保护交互的代理系统，并实现双向对齐以帮助用户调整信任水平。