LLM2D

摘要

arXiv:2501.02564v3 宣告类型: replace-cross 摘要：多视角聚类（MvC）的目标是整合不同视角的信息，以增强模型捕捉潜在数据结构的能力。在多视角聚类中广泛使用的联合训练 paradigm 可能无法充分利用多视角信息，因为统一的学习目标导致所有视角的视角特异性特征之间存在不平衡和未优化的问题。例如，在联合训练 paradigm 中，特定视角的信息更为突出，会主导学习过程，从而导致其他视角被欠优化。为了缓解这一问题，我们首先从每个视角特异性特征提取器的梯度下降的角度分析多视角聚类中联合训练 paradigm 的不平衡现象。然后，我们提出了一种新颖的平衡多视角聚类（BMvC）方法，该方法引入了视角特异性对比正则化（VCR）来调节每个视角的优化。具体来说，VCR 保留了从联合特性和视角特异性特征中捕获的样本相似性，并将其保留在与视角特异性特征对应的聚类分布中，以增强视角特异性特征提取器的学习过程。此外，还提供了一种理论分析，以说明 VCR 会自适应地调节用于更新视角特异性特征提取器参数的梯度的大小，以实现一种平衡的多视角学习过程。通过这种方式，BMvC 在充分利用视角特异性模式和探索视图不变性模式之间取得了更好的平衡，以便充分利用聚类任务的多视角信息。最后，通过在八个基准 MvC 数据集上进行的一系列实验，验证了所提出方法相比现有先进方法的优势。