如何把近十页的论文读成半页?

Posted Datawhale

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何把近十页的论文读成半页?相关的知识,希望对你有一定的参考价值。

 卷友们好,我是rumor。

最近李沐沐神横空出世,开始在知乎和B站上传各种课程和论文解读视频,一下就拉高了技术自媒体的门槛,让我开始思考要不要转向舞蹈区或者鬼畜区。大佬果然做什么事情都能做好,从年初3月份到现在,B站已经突破了十万粉,投稿104个,这是深度垂直内容很难达到的高度(不过相信照现在ML的卷度有望成为百大)。

沐神甚至开始专门为大家开启了斯坦福课程中文版,而且是日更,每天B站闲逛的我刷到时都倍感焦虑(因为我没在学习),底下评论区都劝沐神要多注意休息。还有的同学说整个实验室包括导师都在追沐神的课,B站智能姬也专门为评论区的同学灰度了字幕功能,这个学习气氛真的太浓郁了,甚至有同学说沐神直接在B站带研究生

总之引用评论区同学的一句话就是,Mu Li Is All You Need。还在入门的同学跟着走就行了(我的文章也可以偶尔看看,疯狂求生)。

今天就顺着沐神的视频「如何读论文」,也分享一些我的个人私货

地址:https://www.bilibili.com/video/BV1H44y1t75x

看了沐神的视频后,真是相见恨晚。其实我自己读论文的方法也差不多,但却是我迭代了一两年才迭代出来的,如果最开始就知道这个方法会省去很多时间

在我最开始读论文的时候,必须要把所有文章都打印出来,从头读到尾,用笔去各种划线做笔记。只有脱离屏幕,我才能静下心来把那些东西装进脑子里。直到后来我打印的论文越来越多,才不得已在电脑上看。再后来因为写知乎博客,在那段BERT变体疯狂出世的时期,我读论文的速度越来越快,总想第一个把新研究分享出来,当知乎NLP前沿最快的女人。到了现在,我似乎又比之前提高了一些,大家有时会惊讶于我出文的速度,如果文章不太复杂的话,我其实读了标题、摘要、图表之后就开始打草稿了。。。

1.沐神视频总结

论文通常分为6个部分:Title、Abstract、Introduction (包含Related works)、Method、Experiments、Conclusion。

沐神建议大家分三遍来读一篇论文。

第一遍,目的是大概知道论文在讲什么,适不适合自己。先读一下标题和摘要,了解论文在做什么,再直接看结论,虽然大部分都是重复的,但也会把摘要里提到的问题用实际结论再证明一下。再去瞄一眼关键的图和表。这一遍大概要十几分钟,如果确定适合自己,就可以开始第二遍。

第二遍,通读一遍文章,目的是了解文章解决了什么问题,用了什么方法,搞清楚重要的图和表都在干什么,相比别人的方法有什么优点。读的时候可以把有用的东西圈出来,比如重要的参考文献、不懂的句子。这一遍不用特别细节,一些公式和证明可以略过。这遍读完后,如果觉得这份工作对自己有价值,可以继续第三遍的精读。

第三遍,知道每一段每一句都在干什么,把自己放到作者的位置,开始思考自己如何去解决这个问题,如何设计实验,能不能做得更好,或者哪些地方可以继续深入。这样以后基于这份工作扩展,或者使用这个方法的时候就会更自如。

以上就是沐神分享的方法,我的整体差不多,只是不同场景会有diff。一类场景是某类论文的集中调研,可能是项目要落地,也可能是要做research,总之会有个大概的领域和任务限定;另一类场景是随便读读,毕竟周围的人都读,不进则退,被迫好学。下面就分这两个场景介绍一下我的方法。

2.有方向的调研

首先是怎么找论文,这是我后台经常收到的问题。在做research之前一定要调研充分,否则论文都写了一半发现跟之前的撞了,或者审稿人直接给你丢过来一篇就很尴尬。找论文可以从以下四方面:

  1. 先去搜索最近的该领域综述,综述读下来就对该领域有初步理解,知道了历史SOTA

  2. 最近一两年的顶会(NLP比如ACL、NAACL、EMNLP、AAAI、ICLR等),去他们公开的paper list按关键词搜索。怎么找关键词?从之前看的综述里面找

  3. 在Google Scholar等搜索引擎搜关键词,顶会毕竟有几个月的延迟,可能人家先挂出来了

  4. 用上面的方法读了几篇之后,去看他们Related Works、实验对比里的其他方法,基本都是该领域有代表性的

之后是怎么筛选论文,优先看知名会议、机构、作者的文章,一般来说质量还是有保障的。其他的就用沐神的方法先快速扫一下,没价值就不看了。

最后就是读论文了,沐神讲的方法很好,我略微补充几点:

  1. 既然是有方向的调研,就要调研出体系,这个领域有几种问题,每种问题都有什么解决办法,对比起来有什么优缺点

  2. 如果是自己要follow的方法,实验分析环节要仔细的看,怎么处理的数据,用了什么超参数等

  3. 如果要发自己的文章,就要更精细地看一下其他paper都是怎么讲的motivation和contribution

最最后,怎么样想新的idea?就像沐神说的那样,用作者思维去思考,读个一二十篇就能有些感觉。想第一次就发一篇惊世巨作太难了,更多的人还是先follow前人的工作,从其他领域借鉴一些改动,并学习英文的写作方式。所以不要自己干想

3.随便看看

我现在日常就是随便看看,碰到我感兴趣的工作就分享给大家。

首先还是怎么找论文

  1. Arxiv网站每天都会更新大家上传的论文,推荐我之前参与的项目:https://arxiv.xixiaoyao.cn/,我们把论文的作者机构和发表的会议单独筛了出来,方便快速筛选

  2. 顶会paper list也可以刷刷

之后读论文的方法就差不多了。熟能生巧,当对特定领域的论文+偶尔思考超过一定数量之后(感觉自己也就读了不到100篇吧),速度一下就能上去。我速读时的attention主要在

  1. Abstract的重点(也就两三句话)

  2. Introduction中作者提出motivation和contribution那里

  3. Related works里列的方法

  4. Method里面的图表和说明(不太复杂的方法就那么几句话,数据集也都是常见那些)

  5. Experiments里面的主实验、消融实验和其他有趣的分析

这么算下来,一篇方法不复杂的论文半夜纸就能讲清楚,所有故事都能概括成起因经过结果

当然如果要写出来分享给大家,我会把自己放在作者思维再琢磨一下,想想模型处理的细节、哪里不严谨,再去文中找对应的解释。

以上,就是学姐我这么多年积攒的经验了,白嫖的你,开不开心。


整理不易,三连

以上是关于如何把近十页的论文读成半页?的主要内容,如果未能解决你的问题,请参考以下文章

如何将半页纸论文写到十页?

如何将半页纸论文写到十页?

中文词向量论文综述

IJCAI'20最新推荐系统论文聚焦

清华姚班陈丹琦获斯隆奖!与去年得主马腾宇是同班同学,博士毕业论文是近十年最热之一...

CVPR 2018 | 腾讯AI Lab入选21篇论文详解