对监督学习和非监督学习的理解

Posted feng-fengfeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对监督学习和非监督学习的理解相关的知识,希望对你有一定的参考价值。

监督学习通过人为地输入带有标签的训练数据集,使计算机训练得到一个较为合适的模型,对未知标签的数据进行预测。常见的监督学习算法:回归和分类。

1.回归(Regression):通常有两个及以上变量,数据一般是连续的,通过训练集变量之间的关系得到一条模拟训练样本的曲线,对未知数据的因变量进行预测,其中包括线性回归和非线性回归。如房价与面积的问题,就是线性回归。

2.分类(Classfication): 通常用于预测某件事发生的概率,也是输入带有标签的训练集,数据一般是离散的,比如推测某人是否患有肺癌,通过样本训练,可以得到自变量(如是否有吸烟史,是否生活在雾霾地区)的权重,根据该权值可以根据危险因素预测他患肺癌的可能性。

非监督学习由于在许多实际应用中,事先并不知道产生的数据的类别,也没有训练样本对应的类别,所以要从这些没有被标记的数据集学习分类器设计,通过数据之间的内在联系和相似性将他们分成若干类。非监督学习的方法主要有以下两类。

1.基于概率密度函数估计的直接方法:通过分解各个类别的概率密度函数,再将每个类别划分到特征空间,用贝叶斯决策方法设计分类器。

2.基于样本间相似度间接聚类方法:其中非迭代的分级聚类算法——把每一个样本都看成一个类别,给定两个样本相似度的计算方法,计算两个样本的相似度,把相似度最大的类进行合并,在计算新的类与类之间的相似度,直到把相似的所有样本合为一个类为止。

以上是关于对监督学习和非监督学习的理解的主要内容,如果未能解决你的问题,请参考以下文章

监督学习和非监督学习

监督学习和非监督学习

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)

监督学习和非监督学习的区别

监督学习与非监督学习的区别

机器学习中的标签数据和无标签数据