k均值算法

Posted crjia

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k均值算法相关的知识,希望对你有一定的参考价值。

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

实验总牌数为30,分三类进行三轮迭代。

第一轮:抽取聚类中心为:3、4、7.

技术图片

 

 聚类结果为:

技术图片

 

 第二轮:经过求平均后,重新确定聚类中心为:2、4、10

技术图片

 

 第三轮:对上类再进行求平均,选定聚类中心为2、5、10

技术图片

 

 

最终聚类中心稳定在2、5、10,以此为小中大划分。

 

 

2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

 

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

代码:

技术图片

 

散点图显示为:

 技术图片

 

 

4). 鸢尾花完整数据做聚类并用散点图显示.

代码:(经上代码修改来的,稍有瑕疵)

技术图片

 

 散点图:

技术图片

 

 

 

5).想想k均值算法中可以用来做什么?

  最主要的就是进行机器学习啊,再加上如今是大数据时代,数据足够训练模型简直如虎添翼,

应用到生活中的比如,手机上会自动帮你标记哪些是骚扰电话,就是通过许多用户的数据进行机器学习得到的,比如说童话时常,对用户接起来一秒挂断的电话进行记录,被很多用户一秒挂断,就标记是骚扰电话

以上是关于k均值算法的主要内容,如果未能解决你的问题,请参考以下文章

k均值聚类算法、c均值聚类算法、模糊的c均值聚类算法的区别

聚类之K均值聚类和EM算法

K均值聚类算法

聚类--K均值算法

数字数据集上的K-均值聚类

K均值算法