感谢zzy老师给的文档ww原文可以找我要

L1讲义

讲啥不讲啥

从写论文切入,讲的其实是做研究。

不讲技术,几乎不讲英语。

作为junior researchers,技术和英语需要达到什么水平才可以尝试动笔呢?

  • 精读一篇双栏十三页的论文,大约需要一个工作日。怎么算读懂了呢?设计类的文章,能自己画出系统架构图,并讲明白每个细节为什么这样设计;有定理证明的,能自己把文中的所有定理证出来。
  • 精读过两三个学术脉络的所有重要论文。计算机是个比较年轻的学科,每个小的学术脉络顶多也就十几篇重要论文吧。

等等,学术脉络是个啥?

加入对话

我们自己一点创新意识都没有,怎么培养学生的创新意识?只能看看前辈大师们是怎样工作的。

——陈秉乾

“加入对话”在研究的两个不同的阶段都适用:一是在寻找研究题目时,二是在介绍研究成果时。本节集中于前者。部分材料来自人民大学赵益民老师。

不论是延续还是割裂,所有的研究都是与既往知识历程的对话。不尊重科学共同体在同一问题,或相似问题上已经做出的努力,就不要指望自己的成果被别人接受。

学术对话的组成单位是论文,我们先从读一篇论文讲起。

读论文笔记

哪些内容必须记?

  • 技术:做了什么,采用方法——这个大家都会记。
  • 技术之前:作者承认了哪些前人结论,并挑战了哪些结论/前提/现象,或指出了哪些前人忽视之处。
  • 技术之后:作者得出了哪些结论/论点。区分事实和意见:其中哪些是技术贡献直接得出的,哪些是在讨论中作者表达/呼吁/引申的。
  • 完成度和效果:是否彻底解决了这一问题,是否被社区/市场/学术界接受——大家怎么看待这篇论文?为什么?(现在明白开会和同行聊啥了么?明白去开会为啥重要了么?)
  • 启发我想到了哪些idea?

背景、假设、观点、影响和贡献,可能比具体的技术更重要。技术部分之前之后的东西,也是这篇论文延续学术脉络的真正组成部分。

写多详细?自己过几个月翻看笔记也能懂。

记在哪里?写在论文空白处的不叫笔记,只有单独整理到本上/笔记软件里的才叫笔记。为什么不能光写在论文上?

  • 在论文空白处记的笔记会受限于作者的行文顺序,遮蔽了结构化的思考。
  • 单独整理的笔记可以极大地提升自己将来梳理完整学术脉络,和写作时搜索/查阅的效率。读一个博士期间阅读的论文,没有一米也有半米高,即使是电子的,梳理时也会浪费大量的时间在机械运动上。
  • 只有精读之后的第二遍,甚至第三遍整理,才能真正抓住文章的核心——经常是把笔记整理完了,才觉得哪里缺了个逻辑链条,翻回头去看论文,发现当初看漏了,或者作者企图蒙混过关。

梳理学术脉络

梳理学术脉络,就是把对一个问题的所有研究讲成一个故事。把现有重要研究的研究方法、“技术之前”、“技术之后”、“完成度和效果”连在一起,看每个研究如何承认前人的成果,挑战前人的观点,提出自己的观点,并且他们有什么共同忽视的地方。

学术脉络里包括什么?

  • 概述研究进展和不同观点之间的辩论
  • 寻找这些差异产⽣的原因
  • 评论它们各⾃的贡献和局限
  • 总结主流趋势或⼀般性的问题

注意,后三点都部分地在文本之外!

重要的不是作者说了什么,而是那些为了说出必须说出,没有说出已然说出的事实。

——戴锦华

为什么要梳理?

  • 找洞:评估已有研究,发现研究问题。
  • 量洞的大小:知道自己的研究问题在学术脉络和理论传统中所处的位置,知道自己研究问题的重要性。
  • 告诉别人我的洞最大:将来在写作中说服读者自己研究的原创性和重要性。

我博士期间的小老板告诉我,“做研究就是做ppt”:每个ppt是一个学术脉络,通过阅读和重读论文不停地完善这个学术脉络,才能发现最有价值的研究问题。一个额外的好处是随时可以改改拿出去做演讲。

滑铁卢大学Ian Goldberg教授要求每个博士生都先写一篇SoK文章。而且他能给改到一定能发。

我读博开始时完全不会梳理脉络,组里的Claudia Diaz教授开了一门叫Privacy Technologies的课,每节课梳理一个小领域的学术脉络,并要求学生读这个脉络中的三篇重要文章并提交读书笔记,每个笔记写满一页纸,算是从(没有多老的)老祖宗那里学到了很多发现研究问题的方法。

这门课留给同学们最深的印象是,老师您留作业太多了。

所以我这个讲座一周不要求写满三页纸,只要求三四个自然段。给我自己点个赞。

从学术脉络,怎么概括出研究问题?

什么叫好研究?

对于2017年以前的我,什么叫研究?做题。什么叫好研究?做难题

转变是如何发生的?BU的故事:BU是啥——矿工支持——威胁分叉——Yonatan联系我——Yonatan退出——Below MPU的两个攻击:这个题一点儿也不难,一定发不了好文章——神秘人追问的两个关键问题:

  1. “你说这个协议SB,那么到底SB在哪里?为什么大家都觉得它SB?”——因为所有矿工对“合法区块”的定义不一致,破坏了block validity consensus (BVC)。
  2. “为什么是两个攻击,不是三个,四个?”——不是两个。敌手有三类不同的攻击动机,导致不同的攻击策略。

image-20200507161740933

Tip from "1": Embed the technical contributions in a larger context.
Tip from "2": Always start the paper with a table.

引导我们研究的,不是那道题,而是为什么那道题很重要——如果它的确重要的话。中国学生常出的问题是,不知道问题为什么重要,或者题目虽然很难,但不重要。

评价我们研究的,首先是我们解决的问题的重要程度,其次才是我们是否提供了一个完美的解法。我们是否发现了前人研究中忽视的部分?探索了这一研究路径中最关键的问题?开辟了新的研究问题/研究方法?

继续之前那个故事:——传eprint——引发社区论战,Adam Back等大佬翻牌子——the End of BU——各种会议邀请演讲——到Blockstream实习,期间获得了Common Metrics和NC-Max的idea……BU这篇文章最终发表在CoNEXT上(清华/CORE ranking A类,录取率16%)。Common Metrics沿用了这三种incentive models,把市面上所有的链式PoW协议一网打尽,发表在S&P上。NC-Max在征途中。

神秘人和我的婚姻一直坚持到现在。

对于BU写完之后的我,什么叫研究?补全Big Picture里的关键部分。什么叫好研究?我补全的Big Picture够大;我在之前的Big Picture里找到的洞够大。但并不需要把大洞全补上!

写好论文=做好研究

要写一篇好论文,需要具备若干项素质,你觉得哪一项素质最重要?我的看法,最重要的素质是你有强烈的愿望要写一篇好论文。

——郑也夫

会写论文,才能会做研究

BU的故事告诉我们什么?对如何写一篇更好的文章的思考,最终导致了数个更有意义的研究。希望这一系列无比形而下的关于学术写作八股的讲座,能让诸位junior researchers更好地理解学术写作八股和好的学术研究更深层次的一致性,不枉我这一番口chui舌niu。

论文的贡献取决于传播能力

愿意做研究的人,都怀着对科学做贡献的初心。可如果写的论文没有人看,贡献从何体现?

论文怎么才能有人看?直接呈现到潜在听众/读者的眼前。

怎么做到呢?发表到那些同行会看的会议上去(≈顶会)。哪些会议上的文章你会看,诸君自己心里清楚。

近年来众多关于学术研究的研究表明,那些同行不会看的会议上发表的文章,对知识积累真的没有帮助。Then where is your 初心?

(题外话:某个领域的研究者发现,因为该领域顶会文章太多,大家近年来越来越少地引用最近几年的成果。换句话说,因为这个领域顶会多录文章,导致顶会文章也是没什么人看的,反而阻碍了自己学科的知识积累。)

好会议的文章有这么三类:

  • 技术很烂,写作也很烂——这类文章其实不少
  • 技术很好(题目够难),写作可能一般,可能很好
  • 技术上并不难,写作很好

但不会有技术很烂,写作很好的文章。因为写作好的人,知道选择重要的问题去研究,不会把宝贵的写作时间浪费在没有意义的问题上。

(题外话:研究表明,中了顶会以后发Twitter吹一波,有助于增加引用数。)

说了这么多,做研究和写论文的一致性,怎么在学术八股中体现?

Introduction的结构

部分内容来自AMR Editor’s Comments - Positioning a Theory Paper for Publication。这个讲座中会推荐好几个来自管理学的写作指南。

######

 

想看的找我要吧

这里贴太多不合适

 

 

#####

关于偷idea

除非是定理证明这种过于well-defined的问题,“idea撞车”其实没有那么可怕,因为不同人切入同一个问题的方式一定不一样。就算对方比我们早发表,我们还是能找到自己文章的独特价值。

但直接复制粘贴别人的文本拿去发表,或者强行要求加作者的人的确有。所以对于这一系列workshop的作业,如果真怕被偷idea的,可以用之前写的文章。如果暂时没有自己的文章,就从记忆中找一个最喜欢的工作。如果的确想借此机会打磨一下正在写的文章,可以私下联系我。

下课了,诸位快迫不及待地去写作业吧!

 


请叫我zz 这里分享生活里的一切 就当作我昂贵的日记本吧