分类Classification & 聚类Clustering

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分类Classification & 聚类Clustering相关的知识,希望对你有一定的参考价值。

  1. 分类和聚类的区别

  Classification(分类),根据文本的特征或属性,划分到已有的类别中。即分类器classifier已被告知有哪些类别。分类器通过对已知分类的数据进行学习,找到这些不同类的特征,再对未分类的数据进行分类。这种提供训练数据的过程属于监督学习supervised learning。

  Clustering(聚类),聚类问题不清楚数据有几个分类,只是把相似的数据分到一组。因此一个聚类算法通常只需要知道如何计算相似度即可,不需要使用训练数据进行学习,是无监督学习unsupervised learning。

2. 待续

 

 

以上是关于分类Classification & 聚类Clustering的主要内容,如果未能解决你的问题,请参考以下文章

机器学习中分类与聚类的本质区别

半监督聚类/分类

机器学习四大分类

不懂分类和聚类,怎么敢说你懂数据挖掘!

聚类算法-Kmeans算法的简单实现

CS229 1