一文让你看懂人工智能机器学习深度学习和强化学习的关系

Posted 2021-03-21 abdm-989

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了一文让你看懂人工智能机器学习深度学习和强化学习的关系相关的知识，希望对你有一定的参考价值。

如果说信息技术是第三次工业革命的核心，那么人工智能所代表的智能则是下一次工业革命的核心力量。

2016年，谷歌阿尔法围棋以4:1战胜围棋世界冠军、职业九段棋手李世石，不仅让深度学习为人们所知，而且掀起了人工智能的“大众热”。此后，人工智能越来越热，从机器人开发、语音识别、图像识别、自然语言处理到专家系统等不断推陈出新。

技术图片

同时，人工智能技术越来越多地融入到我们的生活中，出现了智能音箱、智能助理、智能机器人等。

根据应用领域的不同，人工智能研究的技术也不尽相同，目前以机器学习、计算机视觉等成为热门的AI技术方向。但是，平常接触中，很多人分不清人工智能、机器学习、深度学习和强化学习的关系。

简单说，人工智能范围最大，涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成孩子大脑，那么机器学习是让孩子去掌握认知能力的过程，而深度学习是这种过程中很有效率的一种教学体系。

有人表示，人工智能是目的，是结果；深度学习、机器学习是方法，是工具。

技术图片


百度百科如此阐释人工智能(Artificial Intelligence)，英文缩写为AI。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。

而机器学习是人工智能的一种途径或子集，它强调学习而不是计算机程序。一台机器使用复杂的算法来分析大量的数据，识别数据中的模式，并做出一个预测——不需要人在机器的软件中编写特定的指令。

机器学习之父Tom Mitchel如此定义机器学习：

每个机器学习都可以被精准地定义为：1.任务；2.训练过程；3.模型表现P。而学习过程则可以被拆解为“为了实现任务T”，我们通过训练E，逐步提高表现P的一个过程。

举个例子，让一个模型认识一张图片是猫还是狗(任务T)。为了提高模型的准确度(模型表现P)，我们不断给模型提供图片让其学习猫与狗的区别(训练过程E)。在这个学习过程中，我们所得到的最终模型就是机器学习的产物，而训练过程就是学习过程。

技术图片

而深度学习则是一种实现机器学习的技术，它适合处理大数据。深度学习使得机器学习能够实现众多应用，并拓展了人工智能的领域范畴。

从安防监控、自动驾驶、语音识别到生命科学等等，深度学习以“摧枯拉朽之势”席卷行业。

以语音识别为例，通过机器学习，语音识别能随着时间向用户学习，最后能达到95%的准确性。但是训练过程是密集的。

而神经网络处理数十亿个口语音频，将语音识别提高到接近100%的准确度，同时还能缩短训练时间。此外，语音识别还通过关键词和主题对原始音频进行分类，并识别发言者，这对音频监控具有广泛而深远的影响。

技术图片

除了深度学习，机器学习中还有非常重要的强化学习。
过去十年，强化学习的大部分应用都在电子游戏方面。未来，在直升机特技飞行、经典游戏、投资管理、发电站控制、让机器人模仿人类行走等领域有着广泛的应用。

基本概念:人工智能,机器学习,深度学习,强化学习的区别和简介

人工智能(Artificial Intelligence)是最早提出的一个专有名词,早在50多年前就有几个计算机科学家提出了人工智能的概念,希望可以制造出可以和人类拥有类似智慧的机器.几十年来这个概念被不断的扩散至各行各业.当然也就带来了各种滥用,一些带了些许自动化算法的软件也被称为人工智能.而通常人们心中的人工智能是美国大片终结者里面的存在.或者至少是钢铁侠盔甲级别的存在才叫人工智能.而目前业界的真实的人工智能还处于早期人工智能阶段,或者叫做弱人工智能,终结者这样的机器人应该才算强人工智能.不过目前离这个目标还有些遥远.人工智能往往结合着制造业,因此说人工智能的时候往往会说机器人.笔者目前在西湖大学的实验中心就是西湖大学人工智能与机器人中心.将人工智能结合机械臂,仿生机器人,纳米机器人甚至是无人机等均属于人工智能与制造业结合的产物.

机器学习(Machine Learning)是实现人工智能的一种手段.也是目前被认为比较有效的实现人工智能的手段.目前在业界使用机器学习比较突出的领域很多,例如计算机视觉,自然语言处理,推荐系统,文本分等,大家生活中经常用到的比如高速上ETC的车牌识别,苹果手机上的Siri,看今日头条时给你推荐的新闻,再比如大家用天猫买东西看评论的时候的评价描述可以看到通过机器学习的算法,在8W多条评价中筛选出关键词,红色的是正面的评价,绿色的是反面的评价,这些都是通过语义分析算法归类得出的.机器学习本质上是通过数学算法来解析数据的规律,学习相关的规律并且用来预测和决策.机器学习主要分为监督学习,无监督学习和半监督学习三种.从算法上来说有贝叶斯分类,决策树,线性回归,决策树和随机森林,主成分分析,流行学习,k-means聚类,高斯混合模型等等.

深度学习(Deep Learning)是一种机器学习的技术,由于深度学习在现代机器学习中的比重和价值非常巨大,因此常常将深度学习单独拿出来说.最初的深度学习网络是利用神经网络来解决特征层分布的一种学习过程.通常我们了解的DNN(深度神经网络),CNN(卷积神经网络),RNN(循环神经网络),LSTM(长短期记忆网络)都是隶属于深度学习的范畴.也是现代机器学习最常用的一些手段.通过这些手段,深度学习在视觉识别,语音识别,自然语言处理(NLP)等领域取得了使用传统机器学习算法所无法取得的成就.

强化学习(Reinforcement Learning),又称再励学习或者评价学习.也是机器学习的技术之一.所谓强化学习就是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大,由于外部给出的信息很少,强化学习系统必须依靠自身的经历进行自我学习.通过这种学习获取知识,改进行动方案以适应环境.强化学习最关键的三个因素是状态,行为和环境奖励.关于强化学习和深度学习的实例,最典型的莫过于谷歌的AlphaGo和AlphaZero两位了,前者通过深度学习中的深度卷积神经网络,在训练了大约三千万组人类的下棋数据,无数度电的情况下才搞出来的模型,而后者使用强化学习的方式,通过自己和自己下棋的方式搞出来的模型.而最终的实验结果也很让人震撼.AlphaGo干败了人类围棋顶尖高手,而AlphaZero干败了AlphaGo.

作者：阿里云云栖号
链接：https://www.zhihu.com/question/279973545/answer/444230992
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

人工智能并不是一个新的术语，它已经有几十年的历史了，大约从80年代初开始，计算机科学家们开始设计可以学习和模仿人类行为的算法。在算法方面，最重要的算法是神经网络，由于过拟合而不是很成功（模型太强大，但数据不足）。尽管如此，在一些更具体的任务中，使用数据来适应功能的想法已经取得了显着的成功，并且这也构成了当今机器学习的基础。在模仿方面，人工智能专注于图像识别，语音识别和自然语言处理。人工智能专家们花费了大量的时间来创建诸如边缘检测，颜色配置文件，N-gram，语法树等。不过，这些进步还不足以达到我们的需求。

传统的机器学习：机器学习（ML）技术在预测中发挥了重要的作用，ML经历了多代的发展，形成了具有丰富的模型结构，例如：1.线性回归。2.逻辑回归。3.决策树。4.支持向量机。5.贝叶斯模型。6.正则化模型。7.模型集成（ensemble）。8.神经网络。这些预测模型中的每一个都基于特定的算法结构，参数都是可调的。

训练预测模型涉及以下步骤： 1. 选择一个模型结构（例如逻辑回归，随机森林等）。 2. 用训练数据（输入和输出）输入模型。 3. 学习算法将输出最优模型（即具有使训练错误最小化的特定参数的模型）。每种模式都有自己的特点，在一些任务中表现不错，但在其他方面表现不佳。但总的来说，我们可以把它们分成低功耗（简单）模型和高功耗（复杂）模型。选择不同的模型是一个非常棘手的问题。由于以下原因，使用低功率/简单模型是优于使用高功率/复杂模型：在我们拥有强大的处理能力之前，训练高功率模型将需要很长的时间。在我们拥有大量数据之前，训练高功率模型会导致过度拟合问题（因为高功率模型具有丰富的参数并且可以适应广泛的数据形状，所以我们最终可能训练一个适合于特定到当前的训练数据，而不是推广到足以对未来的数据做好预测）。然而，选择一个低功率的模型会遇到所谓的“欠拟合”的问题，模型结构太简单，如果它复杂，就无法适应训练数据。（想象一下，基础数据有一个二次方关系：y = 5 * x ^ 2;你无法适应线性回归：y = a * x + b，不管我们选择什么样的a和b。为了缓解“不适合的问题”，数据科学家通常会运用他们的“领域知识”来提出“输入特征”，这与输出关系更为直接。（例如，返回二次关系y = 5 * square（x），如果创建了一个特征z = x ^ 2，则可以拟合线性回归：y = a * z + b，通过选择a = 5和b = 0）。

机器学习的主要障碍是特征工程这个步骤，这需要领域专家在进入训练过程之前就要找到非常重要的特征。特征工程步骤是要靠手动完成的，而且需要大量领域专业知识，因此它成为当今大多数机器学习任务的主要瓶颈。换句话说，如果我们没有足够的处理能力和足够的数据，那么我们必须使用低功耗/更简单的模型，这就需要我们花费大量的时间和精力来创建合适的输入特征。这是大多数数据科学家今天花时间去做的地方。

神经网络的回归：在大数据时代，云计算和大规模并行处理基础架构的共同发展，使得机器处理能力在二十一世纪初得到了极大的提升。我们不再局限于低功耗/简单的模型。例如，当今最流行的两种主流机器学习模型是随机森林和梯度提升树。尽管如此，两者都非常强大，并且提供了非线性模型拟合的训练数据，但数据科学家仍然需要仔细地创建特征以获得良好的性能。与此同时，计算机科学家重新使用神经网络的许多层来完成这些人类模仿的任务。这给DNN（深度神经网络）带来了新的生机，并在图像分类和语音识别任务方面提供了重大突破。DNN的主要区别在于，你可以将原始信号（例如RGB像素值）直接输入DNN，而不需要创建任何域特定的输入功能。通过多层神经元（这就是为什么它被称为“深度”神经网络），DNN可以“自动”通过每一层产生适当的特征，最后提供一个非常好的预测。这极大地消除了寻找“特征工程”的麻烦，这是数据科学家们最喜欢看到的。DNN也演变成许多不同的网络拓扑结构，所以有CNN（卷积神经网络），RNN（递归神经网络），LSTM（长期短期记忆），GAN（生成敌对网络），转移学习，注意模型（attention model）所有的这些被统称为深度学习（Deep Learning），它正在引起整个机器学习界的关注。

强化学习：另一个关键组成部分是关于如何模仿一个人（或动物）的学习，设想感知/行为/奖励循环的非常自然的动物行为。一个人或者一个动物首先会通过感知他或者她所处的状态来了解环境。在此基础上，他或者她会选择一个“动作”，将他或者她带到另一个“状态”。那么他或她将获得“奖励”，循环重复，直到他或她消失。这种学习方式（称为强化学习）与传统监督机器学习的曲线拟合方法有很大不同。尤其是，强化学习学习得非常快，因为每一个新的反馈（例如执行一个行动并获得奖励）都被立即发送到影响随后的决定。强化学习也提供了预测和优化的平滑整合，因为它在采取不同的行动时保持当前状态的信念和可能的转换概率，然后做出决定哪些行动可以导致最佳结果。

深度学习+强化学习= AI与经典的ML技术相比，DL提供了一个更强大的预测模型，通常可以产生良好的预测结果。与经典优化模型相比，强化学习提供了更快的学习机制，并且更适应环境的变化。

机器学习 vs 深度学习在深度探讨machine learning和data science的联系之前，这里简要地讨论一下machine learning 和deep learning。machine learning是一套算法，来训练数据集做预测或者采取行动以使得系统最优化。举例来说，supervised classification algorithms被用来根据历史数据将想要贷款的客户分成预期好的和预期差的(good or bad prospects)。对于给定的任务(比如监督聚类)，需要的技术多种多样：naive Bayes、SVM、neural nets、ensembles、association rules、decision trees、logistic regression，或者是很多技术的组合。所有这些都是数据科学的子集。当这些算法自动化后，比如无人驾驶飞机或者无人驾驶汽车，这就叫AI了，或者说的具体一点，deep learning。如果采集的数据来自传感器并且通过互联网传播，那么这就是机器学习或数据科学或深度学习应用于物联网了。有些人对深度学习有不同的定义，他们认为深度学习是更深层次的神经网络(一种机器学习的技术)。

AI(Artificial Intelligence)是创建于20世纪60年代的计算机科学的一个子领域，是关于解决那些对人类来讲非常容易但是对计算机而言很难的任务。值得一提的是，所谓的strong AI可能可以做所有人类可以做的事情(可能除了纯粹的物理问题)。这是相当广泛的，包括各种各样的事情，比如做计划，在世界上到处溜达，识别物体和声音，说话，翻译，社交或者商业交易，还有创造性工作(比如写诗画画)等等。
NLP(Natural language processing)只是AI要处理的语言部分，尤其是写。Machine learning是这样的一种情况：给出一些可以被以离散形式描述的AI问题(比如从一系列动作中选出对的那个)，然后给定一堆外部世界的信息，在不需要程序员手动写程序的情况下选出那个“正确的”行为。通常情况需要借助外界的一些过程来判断这个动作对不对。在数学上，这就是函数：你给一些输入，然后你想要他处理一下得到正确的输出，所以整个问题就简化为用一些自动的方式建立这种数学函数模型。和AI区分一下：如果我写了一段特别机智的程序有着人类的行为，那这就可以是AI，但是除非它的参量都是自动从数据中学会的，否则就不是机器学习。
Deep learning是当下非常流行的机器学习的一种。它包含一种特殊的数学模型，可以想成是一种特定类型的简单块的组合(或者说是块的功能的组合)，这些块可以进行调整来更好的预测最终结果。
原文：http://click.aliyun.com/m/1000006623/更多技术干货敬请关注云栖社区知乎机构号：阿里云云栖社区 - 知乎发布于 2018-07-16? 赞同 96??3 条评论?分享?收藏?感谢收起
?Xenophon Tony?Uber 机器学习工程师24 人赞同了该回答机器学习：一切通过优化方法挖掘数据中规律的学科。深度学习：一切运用了神经网络作为参数结构进行优化的机器学习算法。强化学习：不仅能利用现有数据，还可以通过对环境的探索获得新数据，并利用新数据循环往复地更新迭代现有模型的机器学习算法。学习是为了更好地对环境进行探索，而探索是为了获取数据进行更好的学习。深度强化学习：一切运用了神经网络作为参数结构进行优化的强化学习算法。

以上是关于一文让你看懂人工智能机器学习深度学习和强化学习的关系的主要内容，如果未能解决你的问题，请参考以下文章