聚类算法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聚类算法相关的知识,希望对你有一定的参考价值。

聚类算法是机器学习的一个重要分支,一般采用无监督学习,常见聚类算法分类有K-Means, K-Medoids, GMM, Spectral clustering,Ncut等。

分类:

1. Partitioning approach:

        建立数据的不同分割,然后用相同标准评价聚类结果。(比如最小化平方误差和)目标:找出一个分割,使得距离平方和最小

        典型算法:K-Means, K-Medoids

K-Means算法:

       1. 将数据分为k个非空子集

       2. 计算每个类中心点seed point

       3. 将每个object聚类到最近seed point

       4. 返回2,当聚类结果不再变化的时候stop

 

2. Model-based:

       对于每个类假定一个分布模型,试图找到每个类最好的模型

       典型算法:GMM(混合高斯) 

GMM:将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果。EM应用到GMM进行参数的求解。

3. Dimensionality Reduction Approach:

       先降维,再聚类

       典型算法:Spectral clustering,Ncut

 

以上是关于聚类算法的主要内容,如果未能解决你的问题,请参考以下文章

k均值聚类算法、c均值聚类算法、模糊的c均值聚类算法的区别

「聚类分析」16聚类分析之KMeans算法与K中心点算法

聚类算法--DBSCAN

聚类算法--KMeans

聚类算法(上)06

谱聚类算法总结