凝聚型层次聚类算法对数据集进行分类时，如何对合并的新簇计算簇间距离？

Posted 2023-04-19

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了凝聚型层次聚类算法对数据集进行分类时，如何对合并的新簇计算簇间距离？相关的知识，希望对你有一定的参考价值。

如图，合并了｛1，2｝之后如何计算呀，网上的例题没看懂

簇间距离的计算方法有很多种：

中心距离：每两簇中心点（每簇内各点在各维度的平均数）之间的距离（这道题你用这个就好了）
最短距离：每两簇最近点的距离
最长距离：每两簇最远点距离

另外聚类时的距离算法也有很多种，常用的有两种：
曼哈顿距离：绝对差之和
欧几里得距离：平方差开根，也就是你截图的这种参考技术A 取x1,x3中点,继续按上面的操作

机器学习——层次聚类算法

层次聚类方法（我们做算法的用的很少）对给定的数据集进行层次的分解或者合并，直到满足某种条件
为止，传统的层次聚类算法主要分为两大类算法:
　　●凝聚的层次聚类: AGNES算法(AGglomerative NESting)==>采用自底向.上的策略。
最初将每个对象作为一个簇，然后这些簇根据某些准则被一步一步合并，两个簇间的
距离可以由这两个不同簇中距离最近的数据点的相似度来确定;聚类的合并过程反复
进行直到所有的对象满足簇数目。凝聚类的用的比较多一些
　　●分裂的层次聚类: DIANA算法(DIvisive ANALysis)== >采用自顶向下的策略。首先将
所有对象置于一个簇中，然后按照某种既定的规则逐渐细分为越来越小的簇(比如最大
的欧式距离)，直到达到某个终结条件(簇数目或者簇距离达到阈值)。