聚类分析

Posted bestluna

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聚类分析相关的知识,希望对你有一定的参考价值。

一、相关背景

  • 有监督学习

    给定训练集(x1,y1)(x2,y2) ....(xn,yn)找出他们之间的关系

    即:学习一个函数

  • 无监督学习

    给定训练集:(x1,2,...xn)

    学习一个训练集的划分

二、聚类的应用场合

  • Image segmentaion
  • Data compression
  • clustering
  • market segmentation
  • social network analysis

三、聚类问题的描述

       1、聚类分析主要是发现不同的数据类簇/群组,使得组内的数据具有较高的相似性或相关性,而组间的数据具有较低的相似性或相关性

技术图片

 

  2、类簇划分可以有多个角度

  • Well-Separated Clusters

    在一个组内的数据比组外的任何点都要接近

  •  Contiguous Cluster

技术图片

 

  • Density-based
  • 技术图片
  •  Center-based

技术图片

 

  Shared Property or Conceptual Clusters

技术图片

 

 

 四、常用的聚类算法

  • K-means
  • Hierarchical clustering
  • Gaussian Mixture Model
  • (具体见后面的博文)

 

以上是关于聚类分析的主要内容,如果未能解决你的问题,请参考以下文章

python数据分析-聚类分析(转载)

多元统计学-聚类分析

matlab聚类分析结果怎么看

请问spss中聚类分析的操作步骤

R语言入门--第十四节(聚类分析)

聚类分析