犀语荐书|《神经网络与深度学习》

Posted 犀语科技

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了犀语荐书|《神经网络与深度学习》相关的知识,希望对你有一定的参考价值。

   


每个领域都会有很多经典的经典书籍,那么在机器学习领域特别是神经网络与深度学习领域,小犀今天推荐的复旦大学计算机学院教授、自然语言处理专家邱锡鹏教授的《神经网络与深度学习》这本书就是一本难得适合国人的中文入门教材。这本书不仅能让你对机器学习有所了解,起到入门的作用,同时通过作者对每一个概念、定理和公式的娓娓道来,再配合课后习题的思考,读完这本书在深度学习这个领域每一个读者都会有进一步的认知提升。


那这本书是什么呢?这本书最早原型是邱教授四年前放在网上的一本虽然很简单但富有深意的讲义。2015年复旦大学计算机学院开设了《神经网络与深度学习》课程,当时还没有关于深度学习的系统介绍。再加上讲好深度学习并不是一件容易的事,课程涉及知识点非常多并且比较杂乱,也必须要和实践结合十分紧密。因此作为任课教师,邱教授尝试梳理了深度学习的知识体系,并写了这份讲义放在网上,这份讲义不仅详细阐述了神经网络与深度学习的原理,同时还让读者不仅知其然还知其所以然,把原理背后的数学原理也讲述得非常通透。结果深受广大机器学习爱好者的广泛喜爱和好评,同时也收到了很多热心网友的反馈和鼓励,因此大家强烈要求邱教授出版一份纸质版把神经网络与深度学习以填补这方面理论读物匮乏的现状。


总算前前后后历经邱教授四年多的不断打磨完善,从最初的电子版到最近才刚刚推出这本书的纸质版,千呼万唤始出来,这才有文章一开头封面这本书。在书的纸质版一推出也深受广大机器学习爱好者的好评。小犀在翻看这本书的内容时,发现从最简单的线性模型开始到神经网络再到深度学习,书的每一章都聚焦在一个概念,颇有种写武侠小说的韵味。通过数学推理从本质上去解释机器学习中那些枯燥的概念。


1.绪论

2.机器学习概述

3.线性模型

4.前馈神经网络

5.卷积神经网络

6.循环神经网络

7.网络优化与正则化

8.注意力机制与外部记忆

9.无监督学习

10.模型独立的学习方式

11.概率图模型

12.深度信念网络

13.深度生成模型

14.深度强化学习

15.序列生成模型

附录.数学基础


犀语荐书|《神经网络与深度学习》

图1 书中关于LSTM模型介绍

图2 书中关于变分自编码器介绍

 

从目录的内容编排上,除介绍基本概念外,作者还在书中给出了若干分析实例和理论数学公式推导以及各种模型示意图,不仅展示如何应用不同的理论工具来分析具体的机器学习技术,更通过模型示意图帮助读者构建模型动态演化体系加深对抽象概念的理解。


随着人工智能技术的不断发展和应用,机器学习在近年来备受关注,对机器学习理论感兴趣的专业人士也日益增多。从这本书中我们看到了神经网络和深度学习是完全同步而不可分的,这也是人工智能的实质,是推动人工智能发展的引擎。

同时人工智能正面临着前所未有的机遇与挑战。就如同高楼不可能一夜而起一样,它必须要经历很长时间的发展。而这就意味着我们要在神经网络和深度学习这样的基础层面上做更多具有创新意义的突破。而邱教授这本书就是一个很好的学习开始。


在一些媒体的各种报道中深度学习无疑激发了大众的想象力,但读完这本书后发现其实并不那么复杂。在技术层面上,深度学习主要指大规模运行的大型计算密集型神经网络。这些神经网络往往是由难以用基于逻辑和规则的机器学习方法进行处理的大数据集经过多轮训练迭代而成,如图像、语音、视频和其他内在具有复杂模式的密集数据。


神经网络本身并不新。几乎从现代计算机开创阶段起,神经网络算法已经被研究用于复杂数据流中帮助人们识别隐藏的内在模式。在这个意义上,深度学习是建立在众所周知的机器学习技术上的。然而,当新兴计算复杂度更高的神经网络算法与如今的大数据集合应用到一起,创造出了重大的新机遇。使用低成本的云服务或商业scale-out大数据结构,可以创建这些"深度"模型,并实时应用于大规模应用场景中。


书中提到的神经网络研究起步于上世纪50年代和60年代,最早是为研究人类大脑如何工作而建模出来的。人工智能中提到的神经网络一般由多层节点组成,这些节点相互连接组成一张大网,有如大脑中的神经元。每个节点接收输入信号,接下来,它通过一个预先定义好的激活功能发出一个个输出信号,并传给其他节点,同时确定什么时候节点应该进入活跃状态。简单的,你可以认为节点如何工作取决于其兴奋程度,当一个节点收到一组输入后变得兴奋时,它可以产生一定程度的输出信号,并传递给它的下游节点。有趣的是,一个节点兴奋起来后,它的输出信号可以是正也可以是负;一些节点激活后实际上会抑制另一些节点的兴奋。节点通过互相互连形成一个全连接,每个连接都是一条边有其自己的权重变量。一个连接的权重会调整经过它传输的信号。神经网络通过逐渐调整其整个网络的连接权重,适应和学习如何识别模式,最终只有被正确识别的模式会产生一个完整的遍布全网络的兴奋传递。


一般情况下,输入数据被格式化为一个输入信号,链接到第一层外部节点。这些节点随后向一个或多个隐藏层发送信号,最后输出层节点发出一个"反馈"给外部世界。由于学习是隐含在链路权重中的,实际应用的核心问题是搞清楚怎么调节或训练所有的链路权重以实现正确模式的应答。今天,神经网络主要通过后向传播的增量学习技术,用在训练数据中寻找正确的模式来完成学习过程。当神经网络生成一种有用的方式识别出正确的样本时,该方法相应的给予链路"奖励",当神经网络识别出错误的样本时,则给予惩罚。

 

正因为“智能化”使得神经网络和深度学习技术正在走进企业数据中心,它既能改善公司内部业务效率,还能使关键业务流程更加智能化,让企业朝着数智化演变。它可以涉及到一切领域,从系统文档管理到人脸识别到自动驾驶,凡是人能做的,机器都可以慢慢替代。


然而,不可能存在一个能够适用于任何给定问题的神经网络架构。此时机器学习专业知识就是非常重要的了,因为给定一定数量的节点、其激励功能、一定数量的隐藏层以及所有节点的连接关系(例如是密集连接还是稀疏连接,是否存在内部反馈或循环环路),可能存在无数种潜在的神经网络配置方式。传统研究中,受限于硬件条件,神经网络隐藏层的数量设置得很少,即使如此,神经网络已经展现出超过人类的,惊人的和熟练的学习能力。如今,深度学习神经网络可能具有数百层网络,能够完全胜任深度奥妙问题的处理。

 

在我看来神经网络和深度学习理论的主要内容是分析学习任务的困难本质,为学习算法提供理论保证,并根据分析结果指导算法设计。虽然神经网络和深度学习理论对深入理解机器学习技术非常重要,但由于内容艰深广袤,且来源流派颇为不同,学习难度非常大。


国际上机器学习理论的专业图书很少,往往侧重从理论角度来理解机器学习具体技术,或聚焦于某项具体的学习理论,缺乏全面性和系统性。《神经网络和深度学习理论》试图为有志于机器学习理论学习和研究的读者提供一个入门导引。作者以为,对理论学习和研究来说,弄清楚基础概念和工具尤为重要。因此,本书采取了与上述书籍不同的组织方式,梳理出了神经网络和深度学习理论这个机器学习领域最基础的理论中最为重要概念或理论工具。

读者今后对具体机器学习问题或技术作分析时,特别是神经网络和深度学习方面的问题,可根据条件选择适用的概念或理论工具。

 

作者介绍:



复旦大学计算机科学技术学院教授、博士生导师,于复旦大学获得理学学士和博士学位。目前主要从事自然语言处理、深度学习等方向的研究,在相关领域的高水平国际期刊会议上发表学术论文60余篇,获得自然语言处理领域顶级国际会议ACL2017杰出论文奖、全国计算语言学会议CCL 2019最佳论文奖。领导开发了开源自然语言处理工具FudanNLP、FastNLP,获得了学术界和产业界的广泛使用。2015年入选首届中国科协青年人才托举工程。2018年获得中国中文信息学会“钱伟长中文信息处理科学技术奖青年创新一等奖”,入选清华-中国工程院知识智能联合研究中心和清华大学人工智能研究员联合发布的“2020年度AI2000人工智能全球最具影响力提名学者”。目前担任中国中文信息学会青年工作委员会执行委员、计算语言学专委会委员、中国人工智能学会青年工作委员会常务委员、自然语言理解专委会委员。

 

现在《神经网络与深度学习》已经在各大电商平台均可购买。

购买链接:




以上是关于犀语荐书|《神经网络与深度学习》的主要内容,如果未能解决你的问题,请参考以下文章

荐书丨深度学习框架PyTorch:入门与实践

深度学习之一:神经网络与深度学习

对比《动手学深度学习》 PDF代码+《神经网络与深度学习 》PDF

深度强化学习与深度Q网络

机器学习与网络安全书籍5神经网络与深度学习

对比学习资料《深度学习入门:基于Python的理论与实现》+《深度学习原理与实践》+《深度学习理论与实战基础篇》电子资料