如何阅读研究性论文?
Posted offduty
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何阅读研究性论文?相关的知识,希望对你有一定的参考价值。
原文:Advice on building a machine learning career and reading research papers by Prof.Andrew Ng
如何通过阅读研究型论文来有效的和相对快速地学习? 如果你想通过阅读学术性文献进行学习,无论你是想搭建一个感兴趣的机器学习项目/系统,或者仅仅是想获取更多最新的有关深度学习前沿知识,你应该怎么做?
下面我们会给出了一些基本的方法:
- 创建一份论文清单:试着列出一份你所关注领域的的研究性论文,或 Medium 文章,以及任何你拥有的文本或学习资源清单;
- 略过该论文清单。你应该以一种并行的方式阅读研究论文,意思是一次处理多篇论文。具体来说,试着快速浏览并理解每一篇文章,而不是全部读完,对于每一篇文章,也许你只读了其中的的10%到20%,这可能足以让你对手头的文章有一个高层次的理解。 之后,你可能会决定删除其中的一些论文,或者只是浏览一两篇论文,把它们通读一遍。
关于到底需读多少论文,Andrew Ng 给出了指导:
- 如果你仅仅是想实现一个语音识别系统,那么阅读有关语音识别方面的 5-20 篇文献就足够了,但是如果你是想研究该领域的前沿问题,那么5-20篇论文可能还不足够。
- 如果你想对某领域,比如语音识别的应用,有一个好的理解,那么你可能需要读 50-100 篇该领域的文章。
那如何阅读一篇论文呢?
对于一篇论文,不要从头读到尾,相反,要多读几篇,下面是具体的方法:
- 第一遍:阅读标题、摘要和图表。通过阅读标题、摘要、关键的网络架构图,可能还有实验部分,你将会对论文的概念有一个大致的了解。 在深度学习领域,有很多研究性论文都是将整篇论文总结成一两个图表,对此,我们不需要费力地通读全文。
- 第二遍:阅读引言、结论、图表,跳过其余的内容。 引言、结论和摘要是作者试图仔细总结他们的工作的地方,以便向审稿人阐明为什么他们的论文应该被接受和出版。 此外,浏览与本文工作相关的章节(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。 因此,它可能是有用的,但如果你不熟悉该领域,有时很难理解。
- 阅读论文,但是跳过数学公式。
- 通读全文,略过没有意义的部分。伟大的研究通常意味着我们是在知识和理解的边界上发表东西。当我们阅读论文(甚至是那些最有影响力的论文),你可能会发现,论文的某些部分可能用的很少或者根本某有意义。 因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。
当你阅读一篇论文时,试着回答以下几个问题:
- 作者试图解决的是什么?
- 该方法的关键要素有哪些?
- 对你有什么用(或者说有哪些可以借鉴的)?
- 有哪些其它的参考文献可以参考的。
如果你能回答上述几个问题,通常可以反映出你对该论文有了比较好的理解。 事实证明,当你读的论文越多,通过练习你获取到上述信息的速度也就越快。因为,很多作者在写论文时使用的是通用格式。
理解一篇论文需要花费多少时间?
对于刚接触机器学习的人来说,理解一篇相对简单的论文可能需要一个小时,这并不罕见。但是,有时你可能会偶然发现需要3个小时甚至更长时间才能真正理解的论文。
如何获取到这些论文?
网络上有很多好的资源。比如,对于新手来说,那些列出了语音识别领域最重要的论文清单的博客可能非常有价值。
随着深度学习的快速发展,很多人都试图跟上它的最新水平,了解最新进展。因此,这些是你应该经常光顾的地方。
- Twitter。 令人惊讶的是,Twitter正成为研究人员发现新事物的重要场所。
- Reddit 中的 ML 子板块
- 重要的机器学习会议:NIPS、ICML、ICLR
- 朋友:找一个对该领域感兴趣的社区或一群朋友,分享有趣的研究论文
如何更深入的理解论文中的数学公式?
试着从头开始重新推导。虽然,这需要一些时间,但这是一个很好的练习。
尝试编码实现
- 下载源码(如果能够找到),并运行。
- 从零开始重新实现:如果你能做到这一点,这是一个强有力的信号,说明你已经真正理解了手头的算法。
不断进步
继续学习和变得更好的最重要的事情是更稳定地学习,而不是进行集中密集的活动。 与其在短时间内死记硬背,不如下一年每周读两篇论文。
以上是关于如何阅读研究性论文?的主要内容,如果未能解决你的问题,请参考以下文章
研究生学习和工作总结(2021.11.01-2021.11.07)-我在b站读研