数据挖掘网格聚类STING概念聚类COBWEB和模糊聚类的讲解(图文解释)
Posted showswoller
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘网格聚类STING概念聚类COBWEB和模糊聚类的讲解(图文解释)相关的知识,希望对你有一定的参考价值。
需要完整PPT请点赞关注收藏后评论区留言私信~~~
除了常用的划分聚类、层次聚类和密度聚类方法之外,还有一些聚类方法如网格聚类方法STING、概念聚类COBWEB和模糊聚类方法等
1.STING算法
STING(Statistical Information Grid_based Method)是一种基于网格的多分辨率的聚类技术,它将输入对象的空间区域划分成矩形单元,空间可以用分层和递归方法进行划分。这种多层矩形单元对应不同的分辨率,并且形成一个层次结构,每个高层单元被划分为低一层的单元。有关每个网格单元的属性的统计信息(如均值、最大值和最小值)被作为统计参数预先计算和存储
STING算法采用了一种多分辨率的方法进行聚类分析,该聚类算法的质量取决于网格结构最底层的粒度,如果粒度较细,处理的代价会显著增加,但如果粒度较粗,则聚类质量会受到影响
STING算法效率高,通过对数据集扫描一次计算单元的统计信息,因此产生聚类的时间复杂度为O(N),在建立层次结构以后,查询的时间复杂度为O(g) g<<n
2.COBWEB模糊聚类
概念聚类是机器学习中的一种聚类算法。大多数的概念聚类方法采用了统计学方法,在决定概念或聚类时使用概率度量。COBWEB算法即简单增量概念聚类算法,以一个分类树的形式创建层次聚类,它的输入对象用分类属性-值对进行描述
分类树和判定树不同,分类树中的每个节点对应一个概念,包含该概念的一个概率描述,概述被分在该节点下的对象,概率描述包括概念和等条件概率
3 .模糊聚类
前面介绍的几种聚类算法可以导出确定的类,即一个数据点最多仅属于一个类,具有非此即彼的性质,这些聚类方法称为确定性分类或者硬划分,而实际上大多数对象并没有严格的所属关系,具有互相包含的关系,因此适合软划分
FCM算法流程图描述如下
FCM算法是一种梯度下降优化算法 对初始值非常敏感并且容易获得局部最优解
创作不易 觉得有帮助请点赞关注收藏~~~
以上是关于数据挖掘网格聚类STING概念聚类COBWEB和模糊聚类的讲解(图文解释)的主要内容,如果未能解决你的问题,请参考以下文章