How to read a paper

研究者花费大量时间在读论文上。但是这个技能却很少人教,这就导致大量时间被浪费。最近居然发现一篇paper,教人如何阅读paper,所以记录如下,与君共勉。

文章来源: https://www.albany.edu/spatial/WebsiteFiles/ResearchAdvices/how-to-read-a-paper.pdf

重要性

  • 在field内保持先进性,keep up the trend
  • 获得灵感
  • review

方法论

作者总结出了three-pass 方法。顾名思义,就是阅读一篇paper三遍。每一遍分别有不同的侧重点。

  • general idea
  • content,but not details
  • understand the paper in depth

第一遍

这一遍快速扫描,用来决定是否需要继续深入读下去。

时间

5-10 min

内容

  • title, abstract, introduction
  • 只看section & subsection headings
  • conclusion
  • 扫一眼reference,排除掉看过的那些paper

目标

看完这一遍要能够回答:

  • 类别:这篇论文是哪一个类别的? 是提出了一个新方法、还是实际分析、或是提出了一个模型?
  • 基于什么理论基础?
  • 是否valid?包括假设是否合理、逻辑是否合理等。
  • 主要贡献?
  • 写的清晰么?

作用

第一遍读完之后,可能你会选择放弃这篇paper。这可能是因为你对论文不感兴趣,或者是你对该领域的了解不足以看懂论文,或者作者做出了无效的假设。 只阅读一遍的论文,适用于阅读不在您研究领域内的论文,可能会给你启发。

启发

注意!但你知道如何读第一遍论文的时候,也要想到反过来,reviewer在读你的论文的时候会如何想。因为大多数reviewer只会读它一次。 所以,注意选择连贯的section & subsection headings,并撰写简洁而全面的摘要。 如果审稿人在一次通读后无法理解要点,那么该论文可能会被拒绝; 如果读者在五分钟后无法理解论文的亮点,那么论文可能永远不会被阅读。

第二遍

第二遍需要读更仔细,但是忽略掉细节,如证明过程。

圈出或写下关键词会有帮助。

内容

  • figure、diagrams、或者其他图表
  • 标记出reference中没有阅读过的paper,这对background的扩展是一个帮助

时间

<= 1小时

目标

  • 能够列举文章的几个主要观点,及其支持的论据

作用

有时候读完第二遍仍然无法理解,那么可能是因为:

  • 你不熟悉这个subject (课题),有很多术语无法理解
  • 作者所用的技术、方法你无法理解
  • 作者写的不好
  • 你太累了

那么现在可以选择:

  • 放一边,祈祷你职业生涯的成功与它无关
  • 看完reference 再来看它
  • 开始第三遍

第三遍

第三遍的时候,随着作者的逻辑,与作者一起假装完成一次推理/实现过程。这一遍要重点关注细节,把每一个statement中暗藏的假设都找出来。并且,还要时刻问自己,如果是自己写/做这一步,会如何做?这也能给future work提供想法。

时间

初学者:4-5小时

熟练工:1小时

目标

  • 能够重构整篇paper的结构

  • 能够说出它的优缺点

  • 最好能够找出它缺少了什么标准、相关工作,或实验、分析技术中可能出现的问题

如何做survey

为了深入一个领域,我们往往需要做某个specific方向的survey。 那么如何做呢?作者也提供了一个很好的三步走思路。

第一步 善用搜索引擎

Google scholar

CiteSeer

dblp

搜索关键词,找出最近的3-5篇paper

用第一遍阅读法阅读它们,并阅读它们的related work部分。如果幸运的话,通过它们,可能就能找到最近的一篇survey,那么就不用自己做survey了~

第二步 找出大佬

找出以上的论文中重复的引用(key paper)、频繁出现的名字(大佬)。下载key papers,并在搜索引擎中搜索大佬们近期的文章。看看这些文章一般发表在什么conference上。为什么要看这些conference呢?因为大佬们的文章一般只会发在top conference上,这能帮你很快找出该领域的顶会。

第三步 利用会议找出高质量文章

通过刚刚找出的顶会,查看最近几年发表的论文中相关的论文。这些高质量的论文+ 第二步中找到的那些key paper, 能帮你快速建立你的第一版survey。

重复上述过程一遍,作为论文补充。