聚类分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聚类分析相关的知识,希望对你有一定的参考价值。

  聚类分析是一种数据归约技术,旨在揭露一个数据集中观测值的子集。它可以把大量的观测值归约为若干个类。 最常用的两种聚类方法是层次聚类hierarchical agglomerative clustering)和划分聚类partitioning clustering)。在层次聚类中,每一个观测值自成一类,这些类每次两两合并,直到所有的类被聚成一类为止。在划分聚类中,首先指定类的个数K,然后观测值被随机分成K类,再重新形成聚合的类。

  对于层次聚类来说,最常用的算法是单联动(single linkage)、全联动(complete linkage )、平均联动(average linkage) 、质心(centroid)和Ward方法。

  

  对于划分聚类来说,最常用的算法是K均值(K-means)和围绕中心点的划分(PAM)。

  

  最近在看分类和聚类,好一段时间没写博客了,主要是觉得这两个问题都比较复杂,好多东西要整理

  
  

 

以上是关于聚类分析的主要内容,如果未能解决你的问题,请参考以下文章

python数据分析-聚类分析(转载)

多元统计学-聚类分析

matlab聚类分析结果怎么看

请问spss中聚类分析的操作步骤

R语言入门--第十四节(聚类分析)

聚类分析