LLM2D
基于自动编码器的深度聚类简介——聚类与深度学习相结合的沙箱探索
An Introductory Survey to Autoencoder-based Deep Clustering -- Sandboxes for Combining Clustering with Deep Learning
作者: Collin Leiber, Lukas Miklautz, Claudia Plant, Christian B\"ohm
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.02087v1

摘要

arXiv:2504.02087v1 宣告类型: cross 摘要:自编码器提供了一种通用的方法,可以从无标签的数据中学习低维度的非线性表示。这可以通过对数据类型或其他领域知识不做任何特殊假设来实现。自编码器的一般性和领域无关性与其简洁性相结合,使其成为研究和发展新的(深度)聚类算法的理想实验平台。基于聚类方法根据相似性对数据进行分组,而自编码器学习到的低维度表示则有助于减轻维度灾难,从而使该任务获益。特别是,自编码器与聚类的结合,称为深度聚类,能够学习特定聚类任务所需的表示,从而产生高质量的结果。本文综述了基于自编码器的基础深度聚类算法,这些算法为许多现代方法提供了构建块。