机器学习-第一节:了解什么是机器学习

Posted 快乐江湖

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习-第一节:了解什么是机器学习相关的知识,希望对你有一定的参考价值。

文章目录

一:机器学习基本概念

(1)机器学习定义

机器学习(ML):从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习不是基于编程形成的结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论

  • 机器学习的过程类似于人们利用历史经验做出预测判断的过程

机器学习过程大致是这样的:首先我们需要在计算机中存储历史的数据,接着利用机器学习算法对这些数据进行处理,这个过程在机器学习中称之为训练,处理的结果可以用来对新数据进行预测,这个结果称之为模型训练和预测是机器学习的两个过程,模型则是此过程的中间输出结果

(2)损失函数

损失函数:机器学习模型关于单个样本的预测值与真实值的差称为损失。损失越小,模型越好,如果预测值与真实值相等,就是没有损失。用于计算损失的函数称为损失函数。常用的损失函数有

  • 0-1损失函数:预测值与真实值不同则损失为1;预测值与真实值不同则损失为0
  • 平方损失函数:预测值与真实值的差的平方; L ( Y , f ( X ) ) = ( Y − f ( X ) ) 2 L(Y,f(X))=(Y-f(X))^2 L(Y,f(X))=(Yf(X))2
  • 绝对损失函数:预测值与真实值的差的绝对值; L ( Y , f ( X ) ) = ∣ Y − f ( X ) ∣ L(Y,f(X))=|Y-f(X)| L(Y,f(X))=Yf(X)
  • 对数损失函数:对于预测值是概率的情况下,取对数损失,因为概率范围为[0,1],所以对数值为(- ∞ \\infty ,0),下面公式取符号的原因是为了让损失大于0; L ( Y , P ( Y ∣ X ) ) = − l o g P ( Y ∣ X ) L(Y,P(Y|X))=-logP(Y|X) L(Y,P(YX))=logP(YX)

二:机器学习范围

机器学习范围:机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系,也与他们形成了很多交叉学科。其中

  • 模式识别=机器学习:两者的主要区别在于前者是从工业界发展起来的概念,后者则主要源自计算机学科

  • 数据挖掘=机器学习+数据库:大部分数据挖掘中的算法是机器学习的算法在数据库中的优化

  • 统计学习近似等于机器学习:机器学习中的大多数方法来自统计学,但是在某种程度上两者是有分别的,这个分别在于:统计学习者重点关注的是统计模型的发展与优化,偏数学,而机器学习者更关注的是能够解决问题,偏实践,因此机器学习研究者会重点研究学习算法在计算机上执行的效率与准确性的提升

  • 计算机视觉=图像处理+机器学习:图像处理技术用于将图像处理为适合进入机器学习模型中的输入,机器学习则负责从图像中识别出相关的模式。

  • 语音识别=语音处理+机器学习:语音识别就是音频处理技术与机器学习的结合。语音识别技术一般不会单独使用,一般会结合自然语言处理的相关技术。目前的相关应用有苹果的语音助手siri等

  • 自然语言处理=文本处理+机器学习:自然语言处理技术主要是让机器理解人类的语言的一门领域。在自然语言处理技术中,大量使用了编译原理相关的技术,例如词法分析,语法分析等等,除此之外,在理解这个层面,则使用了语义理解,机器学习等技术。作为唯一由人类自身创造的符号,自然语言处理一直是机器学习界不断研究的方向

三:深度学习和人工智能

(1)深度学习

深度学习:属于机器学习研究的一个新的方向。其本质就是传统的神经网络发展到了多隐藏层的情况。由于神经网络在隐藏层扩大到两个以上,其训练速度就会非常慢,因此实用性一直低于支持向量机。2006年,Geoffrey Hinton在科学杂志《Science》上发表了一篇文章,论证了两个观点

  • 多隐层的神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;

  • 深度神经网络在训练上的难度,可以通过“逐层初始化” 来有效克服

(2)人工智能

人工智能:人工智能是机器学习的父类。深度学习则是机器学习的子类。如果把三者的关系用图来表明的话,则是下图

人工智能的核心在于机器学习,正是因为机器学习的诞生才使得人工智能走上了正轨

四:机器学习算法

  • 这里只简单介绍,后续文章会深入学习

以上是关于机器学习-第一节:了解什么是机器学习的主要内容,如果未能解决你的问题,请参考以下文章

机器学习_第一节_numpy

《汇编语言》第一节学习心得

第一节:机器学习无监督学习聚类概述及其三个属性

小曾带你深入浅出机器学习(小白入门必备,近3万字带你了解机器学习)

5分钟了解什么是真正的深度学习

什么是机器学习?看完这篇文章你就了解了