LLM2D

摘要

arXiv:2503.22241v2 宣告类型：替换摘要：个性化多重聚类旨在根据不同的用户特定方面生成多样性数据集分割，而不是单一聚类。它最近因其能够适应不同的用户偏好而引起了研究兴趣。最近的方法主要使用CLIP嵌入与代理学习相结合来提取有利于用户聚类偏好的表示。然而，CLIP主要专注于粗略的图像-文本对齐，缺乏对用户兴趣的深入语境理解。为了克服这些局限性，我们提出了一种以代理为中心的个性化聚类框架，该框架利用多模态大型语言模型（MLLMs）作为代理，全面遍历关系图以根据用户兴趣搜索聚类。由于MLLMs的高级推理机制，获得的聚类与用户定义的标准更紧密吻合，而不是CLIP基表示获得的聚类。为了减少计算开销，我们通过使用MLLMs提取的用户兴趣偏嵌入构建关系图来缩短代理的遍历路径。基于嵌入相似性可以过滤掉大量的弱连接边，从而促进代理的有效遍历搜索。实验结果表明，所提出的方法在Card Order和Card Suits基准测试中分别实现了0.9667和0.9481的NMI分数，大幅提高了SOTA模型约140%。