聚类算法
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聚类算法相关的知识,希望对你有一定的参考价值。
聚类算法是机器学习的一个重要分支,一般采用无监督学习,常见聚类算法分类有K-Means, K-Medoids, GMM, Spectral clustering,Ncut等。
分类:
1. Partitioning approach:
建立数据的不同分割,然后用相同标准评价聚类结果。(比如最小化平方误差和)目标:找出一个分割,使得距离平方和最小
典型算法:K-Means, K-Medoids
K-Means算法:
1. 将数据分为k个非空子集
2. 计算每个类中心点seed point
3. 将每个object聚类到最近seed point
4. 返回2,当聚类结果不再变化的时候stop
2. Model-based:
对于每个类假定一个分布模型,试图找到每个类最好的模型
典型算法:GMM(混合高斯)
GMM:将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果。EM应用到GMM进行参数的求解。
3. Dimensionality Reduction Approach:
先降维,再聚类
典型算法:Spectral clustering,Ncut
以上是关于聚类算法的主要内容,如果未能解决你的问题,请参考以下文章