摘要
arXiv:2504.12722v1 Announce Type: cross
摘要:推荐系统在众多实际应用中扮演着核心角色,然而,由于离线指标与在线行为之间的差距,评估其性能仍然是一个重大挑战。鉴于真实用户数据的稀缺性和限制(如隐私问题),我们引入了SimUSER,这是一种充当可信且经济的人类代理的代理框架。SimUSER 首先从历史数据中识别出自洽的人格,丰富用户资料,赋予其独特的背景和个人特征。然后,在这一评估中至关重要的用户,配备了人格、记忆、感知和大脑模块,与推荐系统进行互动。与以往工作相比,SimUSER 在微观和宏观层面上与真实人类更为一致。此外,我们进行了深入的实验,探讨缩略图对点击率的影响、曝光效应以及评论对用户参与度的影响。最后,基于离线A/B测试结果调整推荐系统参数,从而在实际中提高了用户的参与度。