如何把近十页的论文读成半页?
Posted Datawhale
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何把近十页的论文读成半页?相关的知识,希望对你有一定的参考价值。
卷友们好,我是rumor。
最近李沐沐神横空出世,开始在知乎和B站上传各种课程和论文解读视频,一下就拉高了技术自媒体的门槛,让我开始思考要不要转向舞蹈区或者鬼畜区。大佬果然做什么事情都能做好,从年初3月份到现在,B站已经突破了十万粉,投稿104个,这是深度垂直内容很难达到的高度(不过相信照现在ML的卷度有望成为百大)。
沐神甚至开始专门为大家开启了斯坦福课程中文版,而且是日更,每天B站闲逛的我刷到时都倍感焦虑(因为我没在学习),底下评论区都劝沐神要多注意休息。还有的同学说整个实验室包括导师都在追沐神的课,B站智能姬也专门为评论区的同学灰度了字幕功能,这个学习气氛真的太浓郁了,甚至有同学说沐神直接在B站带研究生。
总之引用评论区同学的一句话就是,Mu Li Is All You Need。还在入门的同学跟着走就行了(我的文章也可以偶尔看看,疯狂求生)。
今天就顺着沐神的视频「如何读论文」,也分享一些我的个人私货。
地址:https://www.bilibili.com/video/BV1H44y1t75x
看了沐神的视频后,真是相见恨晚。其实我自己读论文的方法也差不多,但却是我迭代了一两年才迭代出来的,如果最开始就知道这个方法会省去很多时间。
在我最开始读论文的时候,必须要把所有文章都打印出来,从头读到尾,用笔去各种划线做笔记。只有脱离屏幕,我才能静下心来把那些东西装进脑子里。直到后来我打印的论文越来越多,才不得已在电脑上看。再后来因为写知乎博客,在那段BERT变体疯狂出世的时期,我读论文的速度越来越快,总想第一个把新研究分享出来,当知乎NLP前沿最快的女人。到了现在,我似乎又比之前提高了一些,大家有时会惊讶于我出文的速度,如果文章不太复杂的话,我其实读了标题、摘要、图表之后就开始打草稿了。。。
1.沐神视频总结
论文通常分为6个部分:Title、Abstract、Introduction (包含Related works)、Method、Experiments、Conclusion。
沐神建议大家分三遍来读一篇论文。
第一遍,目的是大概知道论文在讲什么,适不适合自己。先读一下标题和摘要,了解论文在做什么,再直接看结论,虽然大部分都是重复的,但也会把摘要里提到的问题用实际结论再证明一下。再去瞄一眼关键的图和表。这一遍大概要十几分钟,如果确定适合自己,就可以开始第二遍。
第二遍,通读一遍文章,目的是了解文章解决了什么问题,用了什么方法,搞清楚重要的图和表都在干什么,相比别人的方法有什么优点。读的时候可以把有用的东西圈出来,比如重要的参考文献、不懂的句子。这一遍不用特别细节,一些公式和证明可以略过。这遍读完后,如果觉得这份工作对自己有价值,可以继续第三遍的精读。
第三遍,知道每一段每一句都在干什么,把自己放到作者的位置,开始思考自己如何去解决这个问题,如何设计实验,能不能做得更好,或者哪些地方可以继续深入。这样以后基于这份工作扩展,或者使用这个方法的时候就会更自如。
以上就是沐神分享的方法,我的整体差不多,只是不同场景会有diff。一类场景是某类论文的集中调研,可能是项目要落地,也可能是要做research,总之会有个大概的领域和任务限定;另一类场景是随便读读,毕竟周围的人都读,不进则退,被迫好学。下面就分这两个场景介绍一下我的方法。
2.有方向的调研
首先是怎么找论文,这是我后台经常收到的问题。在做research之前一定要调研充分,否则论文都写了一半发现跟之前的撞了,或者审稿人直接给你丢过来一篇就很尴尬。找论文可以从以下四方面:
先去搜索最近的该领域综述,综述读下来就对该领域有初步理解,知道了历史SOTA
最近一两年的顶会(NLP比如ACL、NAACL、EMNLP、AAAI、ICLR等),去他们公开的paper list按关键词搜索。怎么找关键词?从之前看的综述里面找
在Google Scholar等搜索引擎搜关键词,顶会毕竟有几个月的延迟,可能人家先挂出来了
用上面的方法读了几篇之后,去看他们Related Works、实验对比里的其他方法,基本都是该领域有代表性的
之后是怎么筛选论文,优先看知名会议、机构、作者的文章,一般来说质量还是有保障的。其他的就用沐神的方法先快速扫一下,没价值就不看了。
最后就是读论文了,沐神讲的方法很好,我略微补充几点:
既然是有方向的调研,就要调研出体系,这个领域有几种问题,每种问题都有什么解决办法,对比起来有什么优缺点
如果是自己要follow的方法,实验分析环节要仔细的看,怎么处理的数据,用了什么超参数等
如果要发自己的文章,就要更精细地看一下其他paper都是怎么讲的motivation和contribution
最最后,怎么样想新的idea?就像沐神说的那样,用作者思维去思考,读个一二十篇就能有些感觉。想第一次就发一篇惊世巨作太难了,更多的人还是先follow前人的工作,从其他领域借鉴一些改动,并学习英文的写作方式。所以不要自己干想。
3.随便看看
我现在日常就是随便看看,碰到我感兴趣的工作就分享给大家。
首先还是怎么找论文:
Arxiv网站每天都会更新大家上传的论文,推荐我之前参与的项目:
https://arxiv.xixiaoyao.cn/
,我们把论文的作者机构和发表的会议单独筛了出来,方便快速筛选顶会paper list也可以刷刷
之后读论文的方法就差不多了。熟能生巧,当对特定领域的论文+偶尔思考超过一定数量之后(感觉自己也就读了不到100篇吧),速度一下就能上去。我速读时的attention主要在:
Abstract的重点(也就两三句话)
Introduction中作者提出motivation和contribution那里
Related works里列的方法
Method里面的图表和说明(不太复杂的方法就那么几句话,数据集也都是常见那些)
Experiments里面的主实验、消融实验和其他有趣的分析
这么算下来,一篇方法不复杂的论文半夜纸就能讲清楚,所有故事都能概括成起因经过结果。
当然如果要写出来分享给大家,我会把自己放在作者思维再琢磨一下,想想模型处理的细节、哪里不严谨,再去文中找对应的解释。
以上,就是学姐我这么多年积攒的经验了,白嫖的你,开不开心。
整理不易,点赞三连↓
以上是关于如何把近十页的论文读成半页?的主要内容,如果未能解决你的问题,请参考以下文章