机器学习——Mini Batch K-Means算法
Posted qianchaomoon
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习——Mini Batch K-Means算法相关的知识,希望对你有一定的参考价值。
Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数; Mini Batch K-Means算法可以减少K- Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法
算法步骤如下:
●首先抽取部分数据集,使用K-Means算法构建出K个聚簇点的模型
●继续抽取训|练数据集中的部分数据集样本数据,并将其添加到模型中,分配给距离最近的聚簇中心点
●更新聚簇的中心点值(每次更新都只用抽取出来的部分数据集)
●循环迭代第二步和第三步操作,直到中心点稳定或者达到迭代次数,停止计算操作
例如,10000个样本,每次拿1000个样本,做一次K-means,无放回。
再取1000个......
以上是关于机器学习——Mini Batch K-Means算法的主要内容,如果未能解决你的问题,请参考以下文章
scikit-learn学习之K-means聚类算法与 Mini Batch K-Means算法