LLM2D

摘要

arXiv:2407.06740v2 宣布类型: replace-cross 摘要：基于用户上传图像的视觉解释是向推荐系统（RS）提供透明度的有效且自包含的方法，但在这种解释范式中使用的数据的内在局限性导致现有的方法使用有较高稀疏性和标签噪声的低质量训练数据。流行的训练丰富方法如模型扩展或大规模数据收集都是昂贵且环境不可持续的，因此我们寻求提供与负责任AI原则相符的更好的视觉解释。在这项工作中，我们通过开发三种新的策略，研究了有利于视觉基推荐系统解释模型的有效且可持续的训练丰富策略的交汇点：1) 使用正未标学习选择可靠的负训练示例，2) 基于变换的数据增强，3) 基于文本到图像生成的数据增强。在三个最先进的解释模型中整合这些策略提高了这些视觉基推荐系统解释模型的相关排名指标的性能5%，且不会牺牲它们在多个实际世界餐馆推荐解释数据集中的实际长期可持续性。