机器学习-K-means聚类及算法实现(基于R语言)

Posted grayling

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习-K-means聚类及算法实现(基于R语言)相关的知识,希望对你有一定的参考价值。

K-means聚类

将n个观测点,按一定标准(数据点的相似度),划归到k个聚类(用户划分、产品类别划分等)中。

重要概念:质心

技术图片

技术图片

K-means聚类要求的变量是数值变量,方便计算距离。

 

算法实现

技术图片

 

R语言实现

 k-means算法是将数值转换为距离,然后测量距离远近进行聚类的。不归一化的会使得距离非常远。

补充:scale归一化处理的意义

两个变量之间数值差别太大,比如年龄与收入的数值差别就很大。

技术图片

步骤

技术图片

第一步,确定聚类数量,即k的值

方法:肘部法则+实际业务需求

技术图片

第二步,运行K-means模型

技术图片

第三步,总结聚类模型结果

技术图片

 

以上是关于机器学习-K-means聚类及算法实现(基于R语言)的主要内容,如果未能解决你的问题,请参考以下文章

R语言:使用机器学习(K-means聚类)进行客户细分

基于R语言的Kmeans聚类算法

K-Means算法:基于聚类的无监督机器学习算法

干货|机器学习:Python实现聚类算法之K-Means

福利机器学习:Python实现聚类算法之K-Means

K-means算法原理与R语言实例