通俗易懂的图解机器学习之机器学习概论

Posted hhh江月

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通俗易懂的图解机器学习之机器学习概论相关的知识,希望对你有一定的参考价值。

❤️通俗易懂的图解机器学习❤️之机器学习概论

(这个是连载的哦…)


一、什么是机器学习

简介:

近些年来,得益于互联网的普及,我们可以非常轻松地获取大 量文本、音乐’ 图片、视频等各种各样的数据。机器学习,就是让 计算机具有像人一样的学习能力的技术,是从堆枳如山的数据(也称 为大数据)中寻找出有用知识的数据挖掘技术。通过运用机器学习技术, 从视频数据库中寻找出自己喜欢的视频资料,或者根据用户的购买 记录向用户推荐其他相关产品等成为了现实。

1、学习的种类

计算机的学习,根据所处理的数据种类的不同,可以分为监督学习、 无监督学习和强化学习等几种类型。

1.1、监督学习

监督学习,是指有求知欲的学生从老师那里获取知识、信息,老师提供对错指示、告知最终答案的学习过程在机器学习里, 学生对应于计算机,老师则对应于周围的环境根据在学习过程中所获得的经验、技能,对没有学习过的问题也何以做出正确解答,使计算机获得这种泛化能力,是监督学习的最终目标监督学习,在手写 文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网页检索、 基因诊断以及股票预测等各个方面.都有若广泛的应用这一类机器 学习的典型任务包括:预测数值型数据的回归、桢测分类标签的分类、 预测顺序的排序等。

1.2、无监督学习

无监督学习,是指在没有老师的情况下.学生自学的过程在机器学习里,基本上都是计算机在互联网中自动收集信息,并从中获取有用信息无监督学习不仅仅局限于解决像监督学习那样的有明确答案的问题,因此,它的学习目标不必区分明确,无监督学习在人造卫星故障诊断、视频分析、社交网站解析和声音信号解析等方面大显身手的同时,在数据可视化以及作为监督学习方法的前处理L具方面,也 有广泛的应用这一类机器学习的典型任务有聚类’异常检测等。

1.3、强化学习

强化学习,与监督学习类似,也以使计算机获得对没有学习过的问题做出正确解答的泛化能力为目标,倡是在学习过程中,不设置老师提示对错,告知最终答案的环节,然而,如果真的在学习过程中不能从周围环境中获得任何信息的话,强化学习就变成无监督学习, 强化学习,是指在没有老师提示的情况下,自己对预测的结果进行评估的方法。通过这样的日我评估,学生为厂获得老师的最高嘉奖而不断地进行学习,婴幼儿往往会为了获得父母的表扬去做努力, 因此,强化学习被认为是人类主要的学习模式之一。强化学习,在机器人的自动控制、计算机游戏中的人工智能,市场战略的最优化等方面均有广泛应用在强化学习中经常会用到回归、分类、聚类和降维 等各种各样的机器学习算法。

2、机器学习的例子

简单介绍的话,差不多就是:1、回归,2、分类,3、异常检测,4、 聚类和5、降维等等。

2.1、回归

回归,是指把实函数在样本点附近加以近似的有监督的函数近似问题。这里,我们来考虑一下以d次方的实数向量;c作为输入,实数值0作为输出的函数y = f(x)的学习问题。在监督学习里,这里的函数关系是未知的,作为训练集的输入输出样本是已知的, 但是,一般情况下,在输出样本的点实值f(x.)中经常会观测到噪声。通过这样的设定,输入样本就是学生向老师请教的问题.,输出样本就是相当于老师对学生的解答,输出样本中包含的噪声则与老师的教学错误或学生的理解错误相对应。老师的知识(无论什么样的问题, 都可以做岀正确的解答)与真实的函数f相对应,使学生获得这个函数就是监督学习的最终目标。如果以f来表示学生通过学习而获得的函数, 那么学生对没有学习过的问题也可以做出正确解答的泛化能力的大小, 就可以通过比较函数f和E的相似性来进行分析。

2.2、分类

分类,是指对指定的模式进行识别的问题。在分类问题中,并不存在类别1比类别3更接近于类别2这样的说法分。类问题只是单纯地对样本应该属于哪一个类别进行预测。并根据预测准确与否来衡址泛化误差,这一点与回归是不同的。

2.3、异常检测

异常检测,是指找出输入样本中所包含的异常数据的问题,在已知正常数据与异常数据的例子的情况下,其与有监督的分类问题是相同的。但是,一般情况下,在异常检测任务中,对于什么样的数据是异常的,什么样的数据是正常的,是事先是未知的,在这样的无监督的异常检测问题中,一般釆用密度估计的方法,把靠近密度中心 的数据作为正常的数据,把偏离密度中心的数据作为异常的数据。

2.4、聚类

聚类,与分类问题相同,也是模式识别问题,但是属于无监督学习的一种。即只给出输入样本然后判断各个样本分别属于中的哪个簇,隶属于相同族的样木之间具有相似的性质,不同簇的样本之间具有不同的性质,在聚类问题中,如何准确地计算样本之间的相似度是很重要的课题。

2.5、降维

降维.是指从高维度数据中提取关键信息,将其转换为易于计算 的低维度问题进而求解的方法。在转换为较低维度的样本之后,应该保持原始输入样本 的数据分布性质,以及数据间的近邻关系不发生变化。

3、机器学习的方法

机器学习有多种不同的流派,本节中,对机器学习中的主要流派,即产生式分类和判别式分类,以及频率派和贝叶斯派的基本方法加以介绍。

这段内容由于有较多的图片,和一些复杂的公式,我们于是直接在这里使用图片进行展示就可以了:

3.1、 图片1:

图1

3.2、 图片2:

图2

3.3、图片3:

图3

3.4、图片4:

图4

END.

谢谢大家的阅读,期待大家的持续关注哦,本专栏里面全都是关于机器学习的内容哦,期待大家关注本专栏鸭。

最后,感谢大家的阅读与支持,期待大家的招财手点个赞,反正也不费啥事嘛。

以上是关于通俗易懂的图解机器学习之机器学习概论的主要内容,如果未能解决你的问题,请参考以下文章

机器学习之深度学习入门

通俗易懂谈机器学习

科普 | 强化学习技术及应用

通俗易懂的机器学习

机器学习-KMeans算法(图解算法原理)

机器学习之概率统计基础,机器学习学习笔记----07