数学之美,第三版
本来想看的是数学史,知乎上有推荐这本书的,就借来看看,这本书和数学史关系不算大,主要讲述的数学在信息领域的应用,网络技术、人工智能、语音识别、比特币,等等。这是一本科普书籍,讲究的是通俗易懂,所以信息密度不大。本书的优势是介绍了数学工具在信息领域当中精妙的运用,怎样把实际问题数学化讲了一些,但和我想象的有差距。这本书对于数学本身的描述深度不大,但是可以加深人们对数学的理解。
数学和语言一样都是信息的载体。
十进制是因为人用手指头数数,而两只手一共十根指头。
在计算机处理自然语言的时候,最初人们的想法是模仿人类的理解方法,通过研究语法语义,让计算机能够理解语言。这种方法后来又被称为飞鸟派。叫这个名字是因为想到如何建造飞机就看鸟是怎么飞的,也就是仿生学。想让计算机理解语言就让计算机模仿人是如何理解语言的。但这种方法研究了几十年。总是会遇到很多的难题,所以进展缓慢。仿生学未必总是有效,现在的飞机依靠的伯努利方程而不是煽动机翼。后来取得突破的是通过统计的方法分析词频,这需要大量的数据、强大的统计模型、和计算机的运算能力。统计方法大获全胜,需要两个条件:第一个条件是统计方法确实比传统方法好很多;第二是坚持传统方法的人都死光了。这个现象其实不光在语言识别领域,在自然科学的很多领域都是这样的。旧的理论被新的理论所取代,是因为坚持旧理论的人都死光了。
贾里克尼是计算机语言学的专家。犹太人。从小生活颠沛流离。后来获得奖学金才上了MIT。作者和贾里克尼同样认为中小学阶段不需要看太多的书。因为那个时期人的智力远不如大学阶段发达,在大学阶段很快就能把中小学阶段欠缺的知识补回来。中小学阶段需要的是树立志向,学习社会经验,增长生活的能力。
贾里克尼对语言学家的印象很坏,他去康奈尔任教就是因为和一名语言学家聊的很好。但他任职之后,那名语言学家却转去写歌剧了。他觉得这些人是那种说起来头头是道,干起活来高不成低不就的人。他甚至说我每开除一名语言学家,我的语音识别系统识别率就会提高一点。这句话后来在业界广为流传。
一个好的数学模型或算法一定是简洁而有效的。
不同的大师性格不同,柯林斯完美主义,喜欢把一个研究方向做到极致,而布莱尔极简主义,喜欢用简单地不能再简单的方法。