面试题：机器学习学习方式主要有哪些？

Posted 2022-12-10 耗子来啦

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了面试题：机器学习学习方式主要有哪些？相关的知识，希望对你有一定的参考价值。

监督学习
监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签，训练一个预测模型，将输入数据映射到标签的过程。其常见应用场景如分类问题和回归问题。常见的有监督机器学习算法包括支持向量机(Support Vector Machine, SVM)，朴素贝叶斯(Naive Bayes)，逻辑回归(Logistic Regression)，K近邻(K-Nearest Neighborhood, KNN)，决策树(Decision Tree)，随机森林(Random Forest)，AdaBoost以及线性判别分析(Linear Discriminant Analysis, LDA)等。深度学习(Deep Learning)也是大多数以监督学习的方式呈现。
非监督式学习
在非监督式学习中，数据并不被特别标识，适用于你具有数据集但无标签的情况。学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等，包括Apriori算法以及k-Means算法。
半监督式学习
在此学习方式下，输入数据部分被标记，部分没有被标记，这种学习模型可以用来进行预测。应用场景包括分类和回归，算法包括一些对常用监督式学习算法的延伸，通过对已标记数据建模，在此基础上，对未标记数据进行预测。常见算法如图论推理算法（Graph Inference）或者拉普拉斯支持向量机（Laplacian SVM）等。
弱监督学习
弱监督学习可以看做是有多个标记的数据集合，次集合可以是空集，单个元素，或包含多种情况（没有标记，有一个标记，和有多个标记）的多个元素。数据集的标签是不可靠的，这里的不可靠可以是标记不正确，多种标记，标记不充分，局部标记等。已知数据和其一一对应的弱标签，训练一个智能算法，将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少，比如相对于分割的标签来说，分类的标签就是弱标签。
自监督学习自监督(self-supervised)既可以认为是有监督(supervised)也可以认为是无监督(unsupervised)，主要取决于如何定义有监督。一般意义上的有监督，是需要提供人为标注的监督信号；自监督需要提供直接在数据上构造的监督信号，比如通过拼图的方式构造，比如通过对比学习的方式构造，总之，自监督的监督信号来源于数据本身的内容，也就是自己给自己监督信号(self的含义)。也可以认为是实例级别的标注，每个样本是一个类。所以，如果按照有人为标注的监督信号是有监督，那么自监督划分到无监督范围。如果按照有监督信号是有监督，那么自监督划分到有监督范围。

在企业数据应用的场景下，人们最常用的可能就是监督式学习和非监督式学习的模型。在图像识别等领域，由于存在大量的非标识的数据和少量的可标识数据，目前半监督式学习是一个很热的话题。当然目前还有自监督的秀也行

喜欢就关注一下啦~~~

以上是关于面试题：机器学习学习方式主要有哪些？的主要内容，如果未能解决你的问题，请参考以下文章