摘要
arXiv:2505.06841v1 类型: cross
摘要: 随着数字媒体平台力求满足不断变化的用户期望,提供高度个性化和直观的电影和媒体推荐已成为吸引和保留观众的关键。传统系统往往依赖于基于关键词的搜索和推荐技术,这使得用户局限于特定的关键词及其组合。本文提出了一种方法,通过建模真实世界的用户互动来生成合成数据集,从而创建反映出各种偏好的复杂聊天式数据。这使用户能够在传统的基于类型、标题和演员的查询之外,表达更为复杂且多变的偏好,比如情绪、情节细节和主题元素。当今的搜索空间中,用户不能编写这样的查询:“寻找一部包含Dire Wolf的作品的奇幻电影,最好设定在一个严苛冰冷的世界里,主题是忠诚与生存。”
基于这些贡献,我们评估了合成数据集在训练和基准测试模型方面的多样性和有效性,特别是在传统数据集通常缺失的领域。这种方法通过使用户能够提出表达性和自然的查询,从而增强个性化和准确性。它为下一代基于对话式AI的搜索和推荐系统奠定了基础,在数字娱乐领域具有重要意义。