4.K均值算法--应用
Posted heiyedeshihouh
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4.K均值算法--应用相关的知识,希望对你有一定的参考价值。
1. 应用K-means算法进行图片压缩
读取一张图片
观察图片文件大小,占内存大小,图片数据结构,线性化
用kmeans对图片像素颜色进行聚类
获取每个像素的颜色类别,每个类别的颜色
压缩图片生成:以聚类中收替代原像素颜色,还原为二维
观察压缩图片的文件大小,占内存大小
答:
读取一张图片并显示出这个图片的文件大小以及占内存的大小:
初始化的原图片是这样的:
原图片的详细信息运行结果:
通过kmeans对图片进行像素分辨率等压缩,并显示出压缩后的详细信息,保存成新的图片命名为0034:
经过处理后,可以得到压缩后图片的文件大小,占用内存大小以及数据结构:
在文件的资源管理器中查看压缩前后图片的大小差异:
将图片进行二次压缩:
展示压缩后的图片,对比第一次压缩以及第二次压缩的画质,可以看出明显压缩:
第一次压缩后:
第二次压缩后:
2. 观察学习与生活中可以用K均值解决的问题。
从数据-模型训练-测试-预测完整地完成一个应用案例。
答:
在生活中,也可以用K均值来解决问题,在这里我用的是二手房链家网站的数据来进行应用。
在这里我们选用在广州市白云区的二手房
首先通过网页爬虫来对数据进行存储为csv表格,将其命名为学号姓名并进行简单的预处理:
运用K均值算法来研究白云区的楼盘价格跟房的面积大小的关系,通过数据可视化可以直观的看到:
具体代码如下:
通过K均值算法的运用,我们可以发现楼盘价格跟房屋的面积大小有着十分密切的关系,面积越大,房价越高。
以上是关于4.K均值算法--应用的主要内容,如果未能解决你的问题,请参考以下文章