机器学习分类总览
Posted gaoyazhao
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习分类总览相关的知识,希望对你有一定的参考价值。
有监督学习
分类:根据训练结果判断输入为哪个已知的类别。
应用:图像识别、人脸识别
回归:预测下一个周期的结果。通过之前的数据训练出模型,然后模型根据当前数据生成未来的预测
应用:股票预测、趋势分析预测
技术:K邻近、决策树、朴素Bayes、SVM、线性回归、随机森林;CNN
优缺点:准确性可控、高,取决于训练数据质量和数量,因此工作量大
无监督学习
聚类:对数据进行自主分类,生成标签,每个类别有相同的标签。(聚类和分类的区别:前者不知道有哪些分类,而后者知道)
应用:异常检测、用户细分、广告与商品推荐、对象生成(GAN)
降维:不同维度的数据具有一定的关联关系,减少有关联的数据,留下真正提供信息的数据。例如,减小文章篇幅、学生年龄-年级强相关性消除
应用:PCA特征提取、AE特征降维
技术:生成对抗网络GAN、K均值聚类算法、自编码器、谱聚类、主成分分析、embedding
优缺点:不训练,只有特征分布,准确性差,不可控
半监督学习/自学习
应用:图像识别、自然语言处理NLP、语音识别、翻译(基于transformer)、文本分类、生物数据分析、语义分析、视频监控、蛋白质预测、基因测序
技术:RNN、基于上下文/时序/对比的自学习、BERT(pre-training + transformer)、Structured Learning
优缺点:需要的标签比较少,同时具有强大的泛化能力,相比无监督学习更准确;缺点是,无标签数据的质量,是否满足假设条件,对于模型有很大的影响
备注:根本原理是,假定相邻的样本具有相似的特征,所有的样本处于同一个分布模式下
强化学习
应用:自动驾驶/ADAS、AlphaGo Zero、机器对话
技术:Q-learning、瞬时差分、蒙特卡洛搜索树
优缺点:对学习数据没有直接依赖,不受人类知识的限制(例如alphaGo zero),但是不容易推广到未知环境中
参考:
有监督无监督半监督的分类:终于有人把监督学习、强化学习和无监督学习讲明白了_大数据-CSDN博客
有监督和无监督算法:有监督和无监督学习都各有哪些有名的算法和深度学习? - 知乎
无监督学习的应用:无监督学习(一)概述-云社区-华为云
半监督:机器学习-算法-半监督学习:半监督学习(Semi-supervised Learning)算法_u013250861的博客-CSDN博客_半监督学习有哪些算法
BERT和Transformer的关系:张俊林:BERT和Transformer到底学到了什么 | AI ProCon 2019 - 云+社区 - 腾讯云 (BERT=pre-training + transformer)
以上是关于机器学习分类总览的主要内容,如果未能解决你的问题,请参考以下文章