我们仍未知道那年所做的学术研究的意义
查看话题 >我对这个时代学术工作的一点看法
The party is over.
——杨振宁
我有种感觉:当今科学世界,不仅在高能物理领域是“the party is over”,在大部分自然、社会、理论科学领域,学术都差不多走到了这样一个“盛宴已过”的状态。很难找到一条全新的、哪怕是小径的道路供年轻科学家们披荆斩棘、开疆拓土,当这些年轻的预备学者们带着拜帖,小心翼翼的地叩开学术的大门,等待他们的是修葺完备的交通网,上面插满了墓碑与旗帜。
以我熟悉的计算机科学为例,理论计算机要解决的问题许多是经年悬而未决的题目,理论计算机科学家像矿工一样,在 open problems 的坑中勤勉地挖掘,搭建支架,以期有朝一日将这个矿坑关闭,令之成为 closed 的状态。这样看,理论计算机科学家更像是某种数学家。
看着那些优美的算法,如此的令人赞叹数学之美,但年轻的科学家自己又能做什么呢?fruit 在哪里呢?手握锄头,去哪里寻找自己的矿坑呢?提出一个有意义的问题比解决它的意义重要百倍,初闻不知曲中意,再见已是曲中人。
听说姚期智先生今年在研究区块链原理,我相信姚先生的理论功底是深不可测的,他在这个领域已经做出了不少颇为 solid 的文章。但同时,我的怀疑也得到了佐证:这样功成名就的科学家也对于寻找矿坑而发愁。
作为另一个例子,我想谈谈当前火热的第三次人工智能浪潮。我对当前的狂热完全是持悲观和消极态度的,我也很惊讶为什么那些智商勉强算是一流的学生竟然在当前这个节点仍然前赴后继地投身于这个领域。
AI 这个概念早在第一台电子计算机问世之前就存在了,并且已有派系之争。现在公认的三大 AI 派系是连接主义、符号主义以及行为主义。这些主义们高龄几十年,是上世纪70年代左右的产物。
简单地说,连接主义主张用逻辑单元模仿人的生物神经元,组成神经网络,也就是所谓的深度学习;符号主义对应的是专家系统,亦即如今的知识图谱;行为主义偏向控制论,可以对应到智能机器人的控制研究。
我在清华上学的前两年,对于前两个主义有所涉猎。神经网络基本是在炒冷饭,其理论基础未曾有突破性进展,之所以荣光再度恢复,主要是得益于摩尔定律的进展。在硬件上,我们可以做许多过去做不了的事情,硬件的性能在过去的这段时间内指数增长的。于是,曾经掣肘神经网络的因素不复存在,祖师爷蒙尘多年的研究终于有了机会展示。但是需要冷静的是,这是机器和硬件工程师的胜利,而不是人工智能专家的成果。研究人员凭借 insight 设计出了许多精巧的网络模型,同时证明了这些模型在各自任务上的胜任力,但这些模型与仿生学是没有关系的,和 intuition 的关系更大,他们在数字关系中寻找直觉逻辑,像搭建乐高积木一样展示自己的思想。那些美丽的准确率往往只限于实验室的环境,难以适应复杂的现实世界,这也决定了强人工智能离我们是遥遥无期的。
不过,我对一些 specialized 的应用仍然满怀信心,比如特定条件下的图像识别。
在这几年,学术界的发现推动了资本的狂欢,资本的狂欢又让学术界进一步狂热,这是一个不健康的正反馈环。一则新闻是这样的,“谷歌新研究使用1024块TPU,将BERT的训练时间从3天成功缩短到76分钟”,TPU 的使用简直丧心病狂,极其浪费水电,可这也有如同摩尔定律一般逼近极限的一日,硬件的红利要结束了;光是我最近在做的语义分割任务,就有了几十种网络模型被提出,其中大部分文章在发表的那一刻变成了明日黄花,少人问津;即使是后来提出的网络,证明性能的方法也不过是在某些经典数据集上一两个百分点的提升,我并非在贬低他们的研究,只是认为这种评价方式让计算机科学沦为了幼稚的实验,而文章中的数学公式也往往是约定俗成的套路,数据集或许比模型对于论文发表更重要。
而符号主义,我认为有一定的可取之处,但我向来是把它当做一种关系型数据库来看待的,本质上是大规模图论算法,从前的专家系统和如今的谷歌知识图谱,都是数据关系。我曾在大二那年进入计算机系一位堪称“学术新星”的年轻老师的实验室,这个老师研究的是知识图谱、社交网络挖掘。据学妹说,这个实验室现在已经非 GPA 前30%的本科生实习生不收了,水涨船高,身价倍涨。但我在那里的半年中,直接让我对学术产生了幻灭感,也促使我提早终止了学术道路。我曾很崇拜那里的一位后来拿了研究生特奖的师兄,当时他带领那个组发了很多基于神经网络的关系提取的文章。当时我还小,初探学术界,师兄让我先读论文我便读,但是读的很痛苦,后来总算明白了他们在干什么、用什么方法干,就是用神经网络从文章中发现实体间的关系,这件事本身是有意义的,但发文章却变成了一种追赶游戏,他们无力提出问题、设计最初的解决方案,而是致力于 follow 经典文章开辟出的道路,follow 当然不是坏事,但我不明白为什么结果往往是打一个丑陋的补丁,自说自话地搞一个不同的概念,可是详细观察就会发现这种不同只是一种变体、一种幸运的改良版,通过训练数据高出的几个百分点(有时甚至小于1)来证明优越性。但他们确实做了足够的工作,用cpp写了很长的训练代码,有得体的公式,这类漂亮文章得以发表在顶级会议上面,但我天生对权威不信任,此时便不禁开始怀疑这是否是一种皇帝的新衣,一种俱乐部游戏。后来几年的大水也众所周知了,录取几百篇文章的顶会迟早变成笑话。
对于AI,the party is going on,但我不想参与了这个派对了。但总有人,无论是高门朱户,还是白丁秀才,去往这场尚盛大的宴席,喝酒吃肉,让 paper shit 变得更大一些,粪土是金钱。
从某通信实验室回来那位专攻网络的副教授,如今也已经 all in AI 了,也开了自己的 shit 坑,这位曾经的高考状元,还是谙熟派对规矩的。
幸好,我最喜欢的邓俊辉老师,没有参与这场游戏,他一直在教数据结构和计算几何这两门课,前者是我上过的最好的课,后者是王垠觉得很棒的课,对比之下,它的对手们垃圾得令人不敢相信。他是君子,出淤泥而不染,目名利而不取,独善其身,是我终身的老师。
最后,我确实一褒一贬,但这只是我本人的情感倾向,无意要求大众的认同;科研没有死亡,只是开始变得缓慢而异化,科研不是大众的,从来都只是天才和幸运儿的游戏,对那些做出突破性研究科学家,我想向他们致以我最崇高的敬意。