面试题:机器学习学习方式主要有哪些?
Posted 耗子来啦
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了面试题:机器学习学习方式主要有哪些?相关的知识,希望对你有一定的参考价值。
-
监督学习
监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签,训练一个预测模型,将输入数据映射到标签的过程。其常见应用场景如分类问题和回归问题。常见的有监督机器学习算法包括支持向量机(Support Vector Machine, SVM),朴素贝叶斯(Naive Bayes),逻辑回归(Logistic Regression),K近邻(K-Nearest Neighborhood, KNN),决策树(Decision Tree),随机森林(Random Forest),AdaBoost以及线性判别分析(Linear Discriminant Analysis, LDA)等。深度学习(Deep Learning)也是大多数以监督学习的方式呈现。 -
非监督式学习
在非监督式学习中,数据并不被特别标识,适用于你具有数据集但无标签的情况。学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等,包括Apriori算法以及k-Means算法。 -
半监督式学习
在此学习方式下,输入数据部分被标记,部分没有被标记,这种学习模型可以用来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,通过对已标记数据建模,在此基础上,对未标记数据进行预测。常见算法如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM)等。 -
弱监督学习
弱监督学习可以看做是有多个标记的数据集合,次集合可以是空集,单个元素,或包含多种情况(没有标记,有一个标记,和有多个标记)的多个元素。 数据集的标签是不可靠的,这里的不可靠可以是标记不正确,多种标记,标记不充分,局部标记等。已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,分类的标签就是弱标签。 -
自监督学习 自监督(self-supervised)既可以认为是有监督(supervised)也可以认为是无监督(unsupervised),主要取决于如何定义有监督。一般意义上的有监督,是需要提供人为标注的监督信号;自监督需要提供直接在数据上构造的监督信号,比如通过拼图的方式构造,比如通过对比学习的方式构造,总之,自监督的监督信号来源于数据本身的内容,也就是自己给自己监督信号(self的含义)。也可以认为是实例级别的标注,每个样本是一个类。所以,如果按照有人为标注的监督信号是有监督,那么自监督划分到无监督范围。如果按照有监督信号是有监督,那么自监督划分到有监督范围。
在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。 在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习是一个很热的话题。当然目前还有自监督的秀也行
喜欢就关注一下啦~~~
以上是关于面试题:机器学习学习方式主要有哪些?的主要内容,如果未能解决你的问题,请参考以下文章