人工智能的数学基础 | AI基础

Posted 悦思悦读

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人工智能的数学基础 | AI基础相关的知识,希望对你有一定的参考价值。


人工智能的基础是数学,这一点已经是确定无疑的共识了。

但“数学”二字所包含的内涵与外延太广,到底其中的哪些内容和当前的人工智能技术直接相关呢?

今天我们就来看看入门人工智能所需要的数学知识。


人工智能必备高等数学知识点清单

AI 技术岗所要求的高等数学知识,大致可以分为四个方面:微积分概率统计线性代数,和最优化理论

每个分领域都至少是一本书(也可以是一摞书)。我们在这里暂且抽取和机器学习、深度学习相关的最基础部分,给大家做一下聚焦:

【微积分】

  • 基础概念(极限、可微与可导、全导数与偏导数)只要学微积分,就必须要明白的概念,否则后面什么都无法继续学习。

  • 函数求导求导是梯度的基础,而梯度是 AI 算法的基础,因此求导非常重要!必须要搞清楚概念,并学会常见函数的导函数求法。

  • 链式法则符合函数求导法则,反向传播算法的理论基础。

  • 泰勒公式和费马引理这两者也是梯度下降法的基础组成,重要程度与求导相同。

  • 微分方程及其求解很重要,是部分机器学习模型求解的必备知识。

  • 拉格朗日乘子法和对偶学习理解 SVM/SVR 的理论基础。SVM/SVR 作为机器学习模型的常用“中坚力量”,其重要程度不言而喻。

  • 【概率统计】

  • 简单统计量(个数、最大值、最小值、中位数、均值、方差)及其物理意义概率统计的概念基础。

  • 随机和抽样随机——概率统计成立的基础;抽样——统计的方法。

  • 频率和概率,以及概率的基本概念搞清什么是概率,它和频率的区别与联系。

  • 几种常见的概率分布及公式(平均分布、二项分布、正态分布……)

  • 参数估计只知道大致的分布,不知道具体的参数怎么办?没关系,我们可以根据估计一下。其中最重要的是极大似然估计

  • 中心极限定理如果不知道某事物的概率分布该怎么办?没关系,就当它符合正态分布好了。可是为什么能这样近似呢?因为我们有中心极限定理呀。

  • 假设验证到底假设得对不对呢?我们根据样本来验证一下。

  • 贝叶斯公式太重要啦!是它使得我们可以根据先验概率来预测后验概率。朴素贝叶斯公式自己就是朴素贝叶斯模型本身啊。

  • 回归分析想想那么多名字里有“回归”的模型吧!

  • 状态转移网络概率链、隐马尔可夫模型和条件随机场。

  • 【线性代数】

  • 向量与标量用向量和标量表示事物特征的差别是什么?

  • 向量空间,向量性质及向量的几何意义所谓高维低维指的是什么?同一个向量能否存在于不同的向量空间里?向量的移动、转向和拉伸是如何做到的?

  • 线性函数什么是线性函数,它具备怎样的性质?

  • 矩阵和矩阵运算矩阵出现的目的是什么?掌握矩阵的基础运算(与常数/向量/矩阵的加法和乘法)。

  • 特殊矩阵(方阵、实对称矩阵、(半)正定/负定矩阵等)及其性质根据不同的性质,我们可以划分出哪些特殊矩阵,它们都有哪些特殊性质?

  • 特征值和特征向量定义、性质,以及特征值求解。

  • 用矩阵求解微分方程

  • 正交什么是正交?函数的正交,向量的正交,和超平面的正交分别是如何形式化表达的,又具备怎样的物理意义。

  • 【最优化方法】

  • 凸函数与极值搞清楚什么是凸函数,凸函数与极值的关系,极值和最值的关系等。

  • 注意国内不同教科书对于“凸”的定义存在不一致的情况,有些书上把其他书上说的“凸函数”叫做“凹函数”。

    直观而言,我们一向说的“凸函数”是那类一维自变量情况下看起来像个“U”,二维自变量下像个碗的那种函数。

  • 最优化什么是最优化问题?什么是最优化方法?无限制条件和有限制条件下的最优化方法基本原理分别是什么?

  • 梯度下降法最基础最常用的最优化方法,以及其他若干最优化方法的基础,务必全面掌握。

  • 其他最优化算法了解其他一些常用最优化方法,例如,牛顿法、共轭梯度法、线性搜索算法、模拟退火算法、遗传算法等。


  • 人工智能背后的数学大神们

    上述知识点,看起来好像有点吓人哦,不像是“我能记得住”的样子。

    有没有办法能够轻松愉快不累且高效地掌握人工智能(机器学习/深度学习)领域要用到的数学知识呢?

    这里推荐一种笔者在探索中逐步发现的,简单直接又有些趣味的方法:以数学家为主线学习高等数学知识 —— 也就是,“以人为轴”学AI数学。

    我们先来看看下面这些画像吧: 

    你能认出几个?

    他们分别是(从左到右从上到下依次):牛顿、高斯、贝叶斯、费马、泰勒、拉格朗日、拉普拉斯、傅立叶,和伯努利。

    说实话,现在全球数以千万计的 AI 技术人员真应该把这些大佬供起来,说咱们的饭碗都是他们赏的也不为过。

  • 牛顿大神发明了微积分;

  • 辅之以费马引理泰勒公式,奠定了如今一切 AI 最优化算法工程实现的理论基础。

  • 拉格朗日乘子法为限定条件下多元函数的最优化问题提供了解法。

  • 数学王子高斯在概率论和线性代数领域的非凡贡献不胜枚举,仅仅高斯分布一项就堪称概率论之抗鼎模型。

  • 贝叶斯让我们可以用既往经验预测未来。

  • 伯努利家族不仅在概率论领域贡献颇丰,就连他家二弟卖给洛必达的“洛必达法则”亦是求解具有不定型的极限的不二法门。

  • 拉普拉斯算子于微积分和线性代数而言都是非常重要的基石。

  • 傅立叶变换在时域信号和频域信号之间的桥梁作用成就了整个语音领域。


  • 当然,还有下面这位:

     

  • 莱布尼茨与牛顿分别独立发明了微积分,他提出的符号系统一直沿用至今。他同样是西方二进制算数体系的提出者和线性代数的重要奠基人。


  • 当然,无论微积分、概率统计还是线性代数,都不是在一日之内形成的学科,都经历了数百年乃至上千年大量人类顶级头脑的思考和探索,对其做出贡献的数学家灿若繁星。

    对照我们亟待掌握的知识点,以这些理论的提出者为基点,沿着数学史学习之,并同步了解数学发展的进程。顺便还可以以大神们之间的交往和恩怨等八卦作为润滑剂。

    如此一路学来,既多了许多趣味,又能追本溯源,了解到这些理论提出的现实背景(例如:物理学的发展及其对数学工具的需求)。

    在学理论的同时了解这一理论最初的作用域和当时解决的实际问题,对于我们理解其中各类概念的物理意义有着极大的帮助。


    “众智汇”愿景


    尽职尽才,允公允能 —— 本社群不定期举行线上分享,组织群友分享知识、经验、资源,以达到让我们每个人的职业生涯得到最大程度的发展的目的


    欢迎扫面下列二维码关注“悦思悦读”公众微信号

    AI on Hadoop--开源AI基础架构

    近两年人工智能技术发展迅速,以Google开源的TensorFlow为代表的各种深度学习框架层出不穷。为了能让国内人工智能技术更好的落地,并且人工智能也是大数据分析的主要方法,作为大数据协同安全技术国家工程实验室牵头公司的360,其系统部大数据团队与人工智能研究院基于长期的研究和实践成果,开发了基于Hadoop大数据能力的人工智能平台XLearning。大数据协同安全技术国家工程实验室是国家发改委批准建设的国家级大数据安全研究创新平台,是大数据领域唯一的由民营企业承担的国家工程实验室。该实验室目前由360公司牵头,主要负责大数据基础架构、安全防护和应用领域方面的研究。

    360XLearning项目负责人李远策表示, XLearning对于开发者意义重大,因为同行业公司都会有类似开发需求,XLearning则可以帮助他们实现调度的统一和服务器资源的复用。随着平台算法库的不断增容和优化,开发者工作难度将大大降低。他们将有更多精力,用于功能的实现和代码的优化。此外,除了人工智能平台XLearning之外,360在大数据开源技术领域也不断创新,如Poseidon系统、pika系统等均是360在大数据领域的独创开源技术。

    XLearning平台将大数据与深度学习相融合,基于Hadoop Yarn完成了TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost等常用深度学习框架的集成,是典型的“AI on Hadoop”的实现。XLearning从今年4月份正式开发上线运行,经多次版本迭代更新,为各学习框架的使用者提供了统一、稳定的调度平台,实现了资源共享,极大的提高了资源利用率,并且具有良好的扩展性和兼容性。

    图3:XLearning架构

    其中,Client是XLearning客户端,负责启动作业及获取作业执行状态; ApplicationMaster主要负责输入数据分片、启动及管理Container、执行日志保存等; Container是作业的实际执行者,负责启动Worker或PS(Parameter Server)进程,监控并向AM汇报进程状态,上传作业的输出等。对于TensorFlow类型作业,还负责启动Tensoard服务。

    XLearning虽然架构简洁,但具有丰富的功能方便用户进行模型训练,并依托于Yarn提供有作业资源的统一管理。首先,Xlearning平台支持TensorFlow、MXNet分布式和单机模式,支持所有的单机模式的深度学习框架,如Caffe、Theano、PyTorch等;其次,XLearning提供多种模式用于数据的输入、输出,包括数据的流式读写、直接HDFS读写等,可根据作业处理的数据量与集群机器硬盘容量,视情况决定所采用的读写方式;再者,为方便用户查看作业信息,XLearning提供可视化界面用于展示作业执行进度和输出日志等内容;另外,XLearning还支持TensorFlow分布式模式的ClusterSpec自动分配构建,单机模式和其他深度学习框架代码不用做任何修改即可迁移到XLearning上,便于用户快速使用;最后,利用深度学习框架本身的Checkpoint机制和直接读写HDFS数据功能,XLearning方便用户实现训练恢复继续执行。

    作为国内人工智能领域的先行者,360公司以平台开源的形式,实现了行业已有资源的集成和优化。相信未来,以360公司牵头的大数据安全协同技术国家工程实验室将为提升我国网络安全和大数据人工智能产业和学界的整体水平贡献更多力量。


    https://github.com/Qihoo360/XLearning

    来源:来自网络


    【AI基础架构系列】



    AI on Hadoop--开源AI基础架构
    AI on Hadoop--开源AI基础架构



    以上是关于人工智能的数学基础 | AI基础的主要内容,如果未能解决你的问题,请参考以下文章

    Python系列-17]:人工智能 - 数学基础 -7- 微积分导数与极值梯度下降法

    人工智能数学基础 | 目录 | 00

    人工智能数学基础:利用导数判断函数单调性凹凸性极值最值和描绘函数图形

    2.机器学习相关数学基础

    机器学习相关数学基础lll

    2.机器学习相关数学基础