系统聚类法

Posted tianjier

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了系统聚类法相关的知识,希望对你有一定的参考价值。

1. 概述

系统聚类法也称为多层次聚类法,分类的单位由高到低呈树状结构,且所处的位置越低其包含的样本点就越少,共同特征越多。这种方法适合于数据量较小的情况,当数据量较大时系统聚类法的速度较慢。

2. 算法核心思想

其做法是开始时把每个样品作为一类,然后把最靠近的两个或若干个样品(即距离最小的群品)首先聚为小类,再将已聚合的小类按其类间距离合并(两两或若干),不断继续下去,最后把一切子类都聚合到一个大类。

3. 算法实现步骤

以n个样本的聚类分析为例,系统聚类法的步骤如下:

1、计算n个样本两两之间的距离。 

2、将每个样本归为一类,根据计算出的样本间的距离合并距离最近的两类为一个新类。

3、再计算新类与其他各类的距离,同样再根据计算出的距离合并距离最近的两类为一个新类。

4、循环以上过程直至类别个数为1。

5、画出各阶段的聚类图并决定类别的个数。

常用的空间距离有:绝对值距离、欧氏距离、切比雪夫距离、马氏距离和兰氏距离等。

以上是关于系统聚类法的主要内容,如果未能解决你的问题,请参考以下文章

三种聚类方法:层次、K均值、密度

聚类方法的区别解读:各种聚类分析

聚类分析方法都有哪些

数学建模暑期集训20:层次聚类法matlab+python

R语言聚类分析

机器学习特征工程之连续变量离散化:聚类法进行分箱