去年起就想过开一个“科研随笔”的新系列,谈谈我在数学科研中的想法与体会。作为一名博二的学生,不敢说有许多科研经历,许多科研的过程也还未有机会体验,所思所想不过基于短短的数年经验。许多观点仅供参考,如果能激起进一步的讨论,让读者与我自己对(数学)科研有更深的理解,便是有所收获。

  想开启这个系列时,便已有许多话题在我脑中。最初(去年时)因为恰好完成了几篇文章,希望以“科研的各个阶段”为主题做一个总述,却由于各种原因并未起笔。恰逢春节假期以来我尝试涉足新的领域(量子拓扑,quantum topology),正好趁着新鲜的科研经历,来谈谈科研中的第一个阶段——开题。

  我将开题理解为从泛泛的学习到具体的某个问题的过程。泛泛的学习不仅指的是学习研究生基础课,也包含对某个特定的子领域大背景的了解。这往往已经是一段漫长的过程,因为特定子领域的大框架往往搭建在数门研究生课之上。以规范场论(gauge theory,这里指数学中的而非物理中的)为例,如果没有学过同调论、纤维丛与示性类、李群,可能无法理解主丛(principal bundle)的概念。而主丛则只是规范场论里最基本的对象,理解规范场论这个领域在做一件什么事还需要涉猎更多的书、文章和学术报告。在这个过程中,需要对某一子领域处理的问题和处理问题的办法有所理解,体会自己究竟对这一子领域是否感兴趣。了解子领域的大框架且明确自己至少对这一领域不感到无趣时,便可以考虑研究这一领域的某个问题。

  学习的过程是在展开一幅宏大的画卷,而科研则是在画卷的空白处自主绘画。平地起高楼往往对初出茅庐的科研人来说较为困难,在已知知识的边界再添一笔则更为可行。不过即使在子领域,经过数年或数十年的发展,已知知识的边界也往往很长——同一个理论可以被应用到不同的情况,可以做不同方向的推广,还可以与许多其他理论发生联系。此前的学习往往只是让人站在了边界的附近,而科研经验的限制让人没有办法短时间内看清边界的全貌。此时导师的指引则尤为重要。

  最直截了当的情况是,导师给出一个现成的问题,并提供最初的一些思路。个人以为这是一种最快能够将一个对科研生活一无所知的人推上科研轨道的方式。因为对一个科研新人来说,往往还没有从做现成习题的风格中脱离出来,对什么样的问题称得上是一个真正的科研问题也丝毫没有体会。一个现成的问题能举出一个最实际的科研问题的例子,而导师提供的思路则像是习题中的提示,让人知道最初从哪个方面去思考。不过即使如此,此处的开题过程也与完成一道课后习题有诸多不同。

  首先,导师对问题的描述往往建立在子领域边界某处的知识,如果只了解子领域的大框架,第一次往往会听不懂问题的描述。此时一个办法是让导师对这一问题提供具体的参考文献,或者对问题中某个概念做一些背景介绍。带着这种模糊的描述去看参考文献,便是向边界上某个点迈近的过程。等到下一次与导师见面时,可以要求导师对问题进行重述,如果有不明白的地方再重复上述的过程,直到彻底明白这一问题的关注点究竟在什么地方。

  其次,导师对于问题最初的思路可能建立在以往处理类似问题的经验上或是对某个具体例子的计算上,对于问题背景一无所知的科研新手而言,学习类似问题的处理办法与重复导师的计算,并去理解这些东西如何诱使导师去想到这个问题,也是一个重要的步骤。弄清问题的来源,一方面能作为热身,迫使自己回顾某些原先略读的定义与定理。此前泛泛的学习过程中,许多性质往往是一个大的定理,将其应用到当下的特殊情况,往往会有更深层次的体会。另一方面,这也是让人沉浸在处理这一问题的氛围中,进而寻求在这一氛围(或者体系)下更为“自然”的一个处理办法。这里的“自然”指的是其他学者普遍使用的一套思考逻辑,这其实也是为未来的写作做准备。

  明白了问题的叙述与问题的源头,进而可以尝试导师给出的办法,这个办法往往不一定奏效——如果完全奏效,那么问题也就不是问题而只是一道待解的习题了。如果办法部分有效,那么关键在于明白为什么前一半有效,到后一半边无效。或者说,寻找无效的关键原因,进而寻找替代的办法。科研的进程往往并不一帆风顺,时常睡前想到一个点子,第二天早上一验算发现完全不可行。不过,持续的思考和保持与导师的讨论是科研稳步前进的动力。这已不属于开题的范围,而是科研走上正轨的体现。所以我们留作以后再谈。

  实际的开题过程中,往往不会集齐“导师给问题+给思路”的完美方案,下面便来谈谈其他情况下的应对方法。

  如果导师给出了一个明确的问题而没有给出思路,甚至不能给出合适的参考文献时,则需要用上述追溯问题源头的办法,先尝试复现与理解导师给出的例子,明确问题的启发点。然后试着自己寻找合适的参考文献,完成从边界附近到边界的过渡。一般而言,即使没有特别合适、一篇便囊括所有重要信息的文献,导师也会多多少少提出一些沾边的文献。以这些文献为起点,便可以引出许多文献可供筛选。我个人一般用三个办法寻找相关文献,并有对应的筛选办法。下面的“本文”指的是作为起点的参考文献。

  其一是该文章的参考文献(References),这一点最简单,因为文末都会列出。最初我觉得我应该遍历所有的参考文献,来完全明白这篇文章的基础。此后我却发现参考文献之间也有巨大差别:有的尤为重要,是这篇文章的立足点和出发点;有的是这篇文章结果的特例或者前人的部分工作;有的是前人的重要定理,引用是为了使用其中的结论,而证明这一结论的办法往往与本文正文无关;有的只是略有相关性的他人工作,引用是为了完善简介(Introduction)里的背景。第一种是需要重点阅读的,有时甚至没有阅读便无法理解本文,重点阅读指的是可以按照对待本文的态度去阅读(这算是一个递归过程?)。后两种则是略读,因为往往在本文正文中做了更全面的重述,不过Introduction还是可以看看的,或许本文因为行文简洁略去了一些大背景和相应的参考文献,在这两种参考文献中或许可以找到。最后一种可以只看个标题或者摘要(Abstract),因为和本文正文不太相关,只是能让人对知识边界的附近有更多的了解。

  其二是引用该文章的文章(Citations)。我一般用semantic scholar 来检索。或许Google Scholar 也有类似的功能(如果有其他网站也请读者多多推荐,下同)。这一部分往往比上一部分与本文更为接近,毕竟参考文献里的文章写的时候,本文还大概率不存在呢(小概率是参考文献与本文同时书写,所以会互相引用)。而且看引用是一个快速明白知识的边界已经被推到何种程度的办法,最新的文章或者已到达边界的文章往往是没有很多引用或者只有作者本人的文章的引用的(比如我的文章……)。相对的,越早的文章一般有更多的引用,如果有一百多个(数学文章三位数的引用算多了!),那遍历一遍也还是有些困难的,好在上面这个网站的Citations会按相关性排列,所以也可以有轻有重。一般而言如果只有二三十个引用,我会选择遍历一遍,其间可以采取上一条中的办法反向判断本文和引用本文的文章之间的关系,来决定是细看还是只看简介或摘要。

  其三是作者的其他文章,对于已发表的,可以用mathscinet 查询,对于预印本,则可以去arxivGoogle Scholar 应该也能再次用用(不过我一般不用,不知道是不是漏了许多重要信息,望读者提醒)。此外有个“黑科技”是在Mathematics Genealogy Project 上查作者的毕业论文标题,然后看看毕业论文。看看作者的导师和师兄弟也是不错,除了用于八卦,还可以像语文课说的那样,知人论世。另一个“黑科技”是作者本人的主页,一般用姓名+homepage都能搜到(除非作者懒得写)。可以看到更多的信息,比如某篇文章的纠错(corrigendum),万一读了半天结果某个定理后来被大家发现是错的就白费时间了。不过即使是同一作者,也会有许多主题的文章(从业越长的科研工作者主题越多),一般主要看与本文直接相关的文章,筛选的办法有相近时间前后的文章、类似标题、相同合作者、看摘要,对于本文不直接相关的文章,可以略看了解一下作者的学术历程。一般对于年轻的科研工作者,如果文章少于二十篇,我大概还是会遍历一下(给他新建个文件夹放进所有他的文章)。

  其四是视频素材,其中主要是基于本文给的报告,这一般可遇不可求,因为许多报告是线下的没有录像,不过疫情倒是提升了录报告的比率,算是一大利好。一旦发现非常值得一看,首先这是个生动版的简介,比看干巴巴的文字效率高多了,其次报告中还会提到本文中略讲的背景知识和相关文献,这也是对正文的一大补充。其次是相关的短课(minicourse)或者作者在所在大学给的高级课程,这两个或许在作者本人的主页中都能够发现。我一般用Youtube 直接搜作者名字或者在google搜作者名字+video。但不一定能找到所有的资源,因为有些视频是在某个具体会议的主页上的,这只能是碰到后再留意了。

  上述四个办法会从一篇文章引出一系列的素材,而这些素材中重要的部分又会再次引出许多素材,理论上这件事可以无限的递归下去。而开题过程中的一大艺术便是判断某一素材的重要性,借用庄子的话“吾生也有涯,而知也无涯”。学习的过程是无穷无尽的,而如果只把学习作为科研的手段,特别是解决某个科研问题的手段,那么无限的素材往往能化归到有限的素材,因为目标对象明确后,所有相关性不大的素材都可以略看,而相关性较大的素材往往只是翻来覆去说同一个大的背景,久而久之看起来也会比较快。科研教会我的一大道理,便蕴含在这判断与取舍之中吧。

  再退一步,如果导师连一个明确的问题都没有给出,只是一个模糊的猜想或者方向,那上述寻找素材的集中办法或许也依旧可行,只是范围会更加广一些,需要更多的时间去判断哪些素材是“重要”(对某个问题而言)的。提出一个好的问题,往往让科研项目成功了一半,导师给出课题相当于直接实现了这一半,而博士生不会永远依赖导师的课题,成为独立的科研工作者的一大标志便是能够自己提出问题。这对于一个科研新手而言并不是易事,所以往往会出现在科研生活的门前打转的情形。我想在这时候,一个合适的办法便是与导师更多交流,尝试提出自己的一些感兴趣的方向或者问题,让导师来判断是否可行,然后再进行上述提及的各种办法。

  如果连一个大方向都没有的话,那可能以我目前粗浅的经验还没有什么很好的处理办法,我觉得在没有目标时,是无法实现参考文献的有效检索的,所有的文章在眼前似乎都是同等重要,所有的细节似乎都在未来的科研中潜在的会被用到,这便让人无从下手了。如果有读者擅长从起步阶段便自己提出问题,我十分希望能从Ta那儿取经学习。如果我未来能够带学生,希望在Ta的起步阶段,还是能给到我所提及的最大的帮助吧(提出问题+给出思路)。

  这次就先谈到这里吧,希望这个系列能够越来越丰富,我也能和越来越多优秀的科研工作者交流。

21:23 2021/3/9
衣服