聚类算法——KMEANS算法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聚类算法——KMEANS算法相关的知识,希望对你有一定的参考价值。

聚类概念

  无监督问题:我们手里没有标签

  聚类:相似的东西分到一组

  难点:如何评估,如何调参

    技术分享

基本概念

  要得到簇的个数,需要指定K值

  质心:均值,即向量各维取平均即可

  距离的度量:常用欧几里得距离和余弦度(先标准化)

  优化目标:

        技术分享

  工作流程:

        技术分享

  优势:

    简单、快速、适合常规数据集

  劣势:

    K值难确定

    复杂度与样本呈线性关系

    很难发现任意形状的簇

      技术分享

 

以上是关于聚类算法——KMEANS算法的主要内容,如果未能解决你的问题,请参考以下文章

求MATLAB实现canopy-kmeans聚类算法的完整代码

Kmeans聚类算法简介(有点枯燥)

K-means 与KNN 聚类算法

Kmeans聚类算法简介

11- 聚类算法 (KMeans/DBSCAN/agg) (算法)

八:聚类算法K-means(20191223-29)