机器学习分类总览

Posted gaoyazhao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习分类总览相关的知识,希望对你有一定的参考价值。

有监督学习

分类:根据训练结果判断输入为哪个已知的类别。

应用:图像识别、人脸识别

回归:预测下一个周期的结果。通过之前的数据训练出模型,然后模型根据当前数据生成未来的预测

应用:股票预测、趋势分析预测

技术:K邻近、决策树、朴素Bayes、SVM、线性回归、随机森林;CNN

优缺点:准确性可控、高,取决于训练数据质量和数量,因此工作量大

无监督学习

聚类:对数据进行自主分类,生成标签,每个类别有相同的标签。(聚类和分类的区别:前者不知道有哪些分类,而后者知道)

应用:异常检测、用户细分、广告与商品推荐、对象生成(GAN)

降维:不同维度的数据具有一定的关联关系,减少有关联的数据,留下真正提供信息的数据。例如,减小文章篇幅、学生年龄-年级强相关性消除

应用:PCA特征提取、AE特征降维

技术:生成对抗网络GAN、K均值聚类算法、自编码器、谱聚类、主成分分析、embedding

优缺点:不训练,只有特征分布,准确性差,不可控

半监督学习/自学习

应用:图像识别、自然语言处理NLP、语音识别、翻译(基于transformer)、文本分类、生物数据分析、语义分析、视频监控、蛋白质预测、基因测序

技术:RNN、基于上下文/时序/对比的自学习、BERT(pre-training + transformer)、Structured Learning

优缺点:需要的标签比较少,同时具有强大的泛化能力,相比无监督学习更准确;缺点是,无标签数据的质量,是否满足假设条件,对于模型有很大的影响

备注:根本原理是,假定相邻的样本具有相似的特征,所有的样本处于同一个分布模式下

强化学习

应用:自动驾驶/ADAS、AlphaGo Zero、机器对话

技术:Q-learning、瞬时差分、蒙特卡洛搜索树

优缺点:对学习数据没有直接依赖,不受人类知识的限制(例如alphaGo zero),但是不容易推广到未知环境中

参考:

有监督无监督半监督的分类:终于有人把监督学习、强化学习和无监督学习讲明白了_大数据-CSDN博客

有监督和无监督算法:有监督和无监督学习都各有哪些有名的算法和深度学习? - 知乎

无监督学习的应用:无监督学习(一)概述-云社区-华为云

半监督:机器学习-算法-半监督学习:半监督学习(Semi-supervised Learning)算法_u013250861的博客-CSDN博客_半监督学习有哪些算法

BERT和Transformer的关系:张俊林:BERT和Transformer到底学到了什么 | AI ProCon 2019 - 云+社区 - 腾讯云 (BERT=pre-training + transformer)

以上是关于机器学习分类总览的主要内容,如果未能解决你的问题,请参考以下文章

机器学习读书笔记01

机器学习01-kNN邻近算法

机器学习 - 分类器评估

机器学习 评价分类结果 (上)

第四十七篇 入门机器学习——分类的准确性(Accuracy)

机器学习01-kNN邻近算法