经验计算机专硕研一新生求教自然语言处理学习?

Posted 机器学习算法与自然语言处理

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了经验计算机专硕研一新生求教自然语言处理学习?相关的知识,希望对你有一定的参考价值。

推荐阅读时间:5min~8min


主要内容:机器学习的学习之路和一些自己对nlp怎么学的感想


怒答一波,写下我个人的机器学习的学习之路和一些自己对nlp怎么学的感想吧!希望对题主有帮助。


注意:我写的只是是机器学习(包括深度学习)和其在nlp上应用的学习之路。自然语言处理是一个很大的门类,ML或DL只是其中一种解决问题的方式方法!当然了,现在最火的也就是DL。


首先我觉得,在学习深度学习之前,是很有必要,很有必要先学机器学习基础的。

有那么一句话,我是赞同的:学习人工智能大数据什么的,一上来就是什么深度学习,那都是耍流氓!


为什么机器学习基础算法重要,以下是我的一些想法:

  • 首先是在深度学习火热的今天,很多人追求速成,更出现什么3天5天8天就精通深度学习算法的扯淡培训班!造成的后果也很明显:很多人甚至不知道过拟合,欠拟合,什么是偏差方差权衡,什么又是生成模型和判别模型等等基础知识。

  • 然后是其实很多机器学习的基础算法思想是通用的,也是很有启发的,就像集成算法的思想,其实在深度学习中也有很多应用。记得我有个师兄就是在做结合集成学习在机器翻译的应用!

  • 最后就是深度学习只是机器学习的一个子集,现在外面公司对深度学习的应用也是比较少的,更多的是一些基础的像逻辑回归或者决策树之类的算法,不想在工作时是成为障碍,那么早学会这些基础算法也就变得必要啦。

  • 总之吧,想学深度学习,各种原因都好,先学习机器学习基础算法,百利而无一害啊,老铁!


下面开启暴走学习:


网易公开课cs229的视频,虽然这视频有点老了,但是,吴恩达老师的经典之作,还是很有必要一看的。然后在看视频同时看西瓜书(《机器学习》)和《统计学习方法》,这两本理论书真的值得一看!其次是实践我用了《机器学习实战》,实践才是检验真理的唯一标准嘛!


学上面的基础,肯定是要用了一段时间,研一的话,我认为可以不用那么着急着上手做科研写论文吧,先把基础打好,是相当值得的。


然后进入深度学习,现在深度学习的课程很多,推荐吴恩达的deeplearning.ai,这个在网易云课堂有中文字幕版的--链接。还有就是经典的cs231n,官网链接,cs231n是有笔记的-链接,当然,知乎上的一些大神对这个笔记进行了翻译---链接。如果看英文很吃力,也可以参考这个翻译。

补充:推荐《deep learning》,《neural network and deep learning》,这两本深度学习的书也值得一看!


广告时间:很多基础是有必要学习的,最近我写了一篇神经网络(容易被忽视的基础知识),算是基础吧!


学好上面的课程,把其中的作业认真完成之后,自然语言之路也就开始了,首先我看得课程是cs224d这个课,这个是nlp的基础入门课,讲了很多如rnn,词向量的基础模型知识,或者seq2seq这样现在nlp领域比较流行的模型。很值得一看!


当然,学完上面的这些,还是有很多其他要学习的,不详细叙述,就扯下我是从哪里学习的吧!比如RL,我看得是UCL Course on RL,再比如火热的GAN模型,首先看原论文咯,在nlp应用的话,安利下知乎上GAN for NLP,(原来,我也想做这个方向的,但后来,也就没有后来了哈哈)还有很多其他什么知识图谱啊,其他nlp的知识啊,就缺的时候再学也是没有问题的吧。


我觉得上面的都学完算是入门深度学习或者说NLP了吧,这个时候到后面,就主要定方向,看论文,看论文,写论文,改论文,看论文,搞事情啦!

注意:工程能力,工程能力,工程能力是关键,能用numpy手写反向传播吗?能手敲cnn,rnn模型吗?学好tensorflow,pytorch(这个个人感觉比tensorflow灵活)的框架,打码搬砖才是是检验理论的唯一标准啊(重要的观点再说一遍),写好代码,在我看来是非常关键的!别老是只会嘴上扯淡,多动手,当然,至于怎么学习代码,推荐莫烦Python,基础入门可以一学!


广告时间:如何做科研,我写过了一篇怎么做科研?是关于如何定课题,如何对待课题或者科研的,写的可能不是很好,但我觉得还是值得一看的哈哈。


大方向题主定的是nlp,正好我也是做nlp的,我认为,综述还是要看的。关于综述,最近有一篇综述,是写的比较好的:arxiv链接。当然,我也看到有上面的兄弟已经贴出了机器之心关于这篇综述的介绍,看完综述,然后思考一下,定小方向!去吧,开启你的科研路程吧!


本来问题应该就这样答完了的,但是,别走呗,让我再扯一下。我的方向是对话系统,这是一个不错的方向,也是一个很有趣的方向。综述的话可以看下:自然语言生成综述,这里有讲对话系统的,也就讲其他与自然语言生成相关的内容。


然后对话系统分为两类,开放域和目标导向型,开放域的可以看看李纪为等人的文章,目标导向型的话,可以先看看这个综述ppt,然后再去看各类论文咯。总之,带着目标去读论文,然后充分思考,结果不会差的!


广告时间:关于目标导向型的对话系统,我写过一篇论文笔记,可以看下哈哈


最后我想说,学习是要付出代价的,学好上面的要一段时间,拿我来说是学习了一年多吧,才基本都学了一遍。人工智能的时代,很多人急于求成,过于功利,浮躁之气从培训班的扯蛋和媒体的各种“吹嘘”散发出来。但是,脚踏实地,在你要用到那些知识的时候,就会让你感到有多么的庆幸啦!


终于写完了,有点乱,码字不易,若觉得有用,别就只收藏啊,点个赞呗~~~

推荐阅读:




以上是关于经验计算机专硕研一新生求教自然语言处理学习?的主要内容,如果未能解决你的问题,请参考以下文章

做一个有主见的女生

深度学习与自然语言处理 - 词向量工具的原理及应用

自然语言处理应用工程师

--22华科计算机专硕上岸经验贴

知名人工智能公司高薪寻访:自然语言处理(NLP)

投资组合动态 | 犀语科技受邀参加自然语言处理(NLP)智能技术应用研讨会