《变、应变,与制变》(13)
维基百科对网页搜索引擎的定义为“用在互联网上搜索信息的工具”。一个典型的搜索引擎由三大功能构成:页面抓取,编制及存储索引,搜索。
把它与第一、二期中脑力模型的定义对照,会发现它们之间有明显的相通之处。其中,页面抓取对应于脑力模型的“信息输入”,编制存储索引对应“信息存储”,至于搜索,因为它只是对已存储信息的再现,我们仍把它对应于“信息输入”阶段。
通过对比发现,人的大脑相当于一台配备了中央处理器(对应大脑的信息处理功能)的搜索引擎,即:
大脑 = 搜索引擎 + 中央处理器
暂时抛开处理器不谈,我们先来分析搜索引擎部分。
如果把人脑看成搜索引擎,不难得出结论,每个人都有各自非常独特的搜索引擎。说得更绝对些,世界上从来都不曾有两个个体,他们的大脑搜索引擎长得一模一样。反过来,也正是搜索引擎的差异才构成了个体间丰富多样的独特性。
这和世界上没有两人有相同指纹、DNA的现象类似。然而人与人之间搜索引擎的不同,无疑要远远大于指纹或DNA之间的不同。为什么呢?因为我们从历史上经常看到人类因认知不同(往往又起始于大脑搜索引擎的不同)而大动干戈甚至绵延成世仇,却从未听说过有谁因为相互间指纹、DNA的不同而打架的(特殊情况如亲子鉴定除外)。
既然拿人脑类比网络搜索引擎,那么有必要了解,一个理想的网络搜索引擎应该具备什么特征?
首先,它抓取了足够多的页面。搜索引擎的价值取决于它对互联网反映的全面真实程度。如果这种反映不够全面甚而不够真实,它的价值就会大打折扣甚至变得毫无用处。
接下来是采用何种技术来编制索引的问题。
最后,它能足够精确地处理搜索出来的结果。特别当结果的数目巨大时,如何确定搜索结果与提交问题的相关性,直接决定了搜索的质量。
说到这里,顺便讨论一下Google与百度的搜索排队问题。在谷歌的开门十件事(公司哲学)里面,第六件就谈到“可以不作恶而照样赚钱”,换句话说,“没人能通过出钱提升自己在谷歌引擎的搜索排名”。——这是谷歌的公开承诺,至于是否做到,全世界的网民都可以来监督。
再看百度,尽管百度的企业文化、使命也写入了诸如“公平、求实”的字眼。但是,我不相信有人会信,百度能在竞价排名的同时,仍保证求实与公平。与其相信这个,我倒更愿意相信猫能照料老鼠、警察开办黑社会的存在。
这些东西能给我们开发大脑带来什么启发?
最大启发是,一个人摄入信息,当首先注意信息的全面性。假使他对世界的认识不够全面,那么认识得再真实也未必有益。(还记得瞎子摸象的故事么?)所谓全面,并非指事无巨细都要逐一了解,因为人的精力倒底十分有限,又无法像计算机那样可以轻松升级。折中的办法是,认识事物应尽量从事物的全景开始,尽管得到的图案会很粗糙,但只要不粗糙到扭曲事实就无碍大局。打个简单比方,好比一个相机虽仅有百万像素,但并不妨碍用它可拍出可信的全景图来——只要还没有粗糙到把树影误认为大象的地步。另外,人的精力虽然有限,但不要忘了身边还有许许多多的工具可以利用。一个人如能善加利用一切可用的工具资源,其效果与并联多台计算机增强性能没有两样。
其次,在大脑记忆即信息存储方面,人脑不可能像计算机那样,能无差别的记住指示给它的任何东西。为什么人对有些东西只要接触一次就留下深刻印象,而有的却要反复多次才能勉强记住?这里面有许多影响因素,理解对象的难易、是否符合自己趣味、附带价值的多少等等,都是可能的原因。这些东西我简单归纳为大脑的选择性接收。选择所基于的标准,暂且归结为人类趋利避害的本性。这是人脑与电脑的本质区别,即,人是有动机的,而电脑没有。至于单纯的信息存储,和前面一样,可借助于各种工具,一张纸条,电脑,互联网,周围的人,等等,都是非常好的手段。
最后,人脑针对特定话题的信息再现排列(搜索),不妨设想是前阶段选择性记忆的自然结果
把它与第一、二期中脑力模型的定义对照,会发现它们之间有明显的相通之处。其中,页面抓取对应于脑力模型的“信息输入”,编制存储索引对应“信息存储”,至于搜索,因为它只是对已存储信息的再现,我们仍把它对应于“信息输入”阶段。
通过对比发现,人的大脑相当于一台配备了中央处理器(对应大脑的信息处理功能)的搜索引擎,即:
大脑 = 搜索引擎 + 中央处理器
暂时抛开处理器不谈,我们先来分析搜索引擎部分。
如果把人脑看成搜索引擎,不难得出结论,每个人都有各自非常独特的搜索引擎。说得更绝对些,世界上从来都不曾有两个个体,他们的大脑搜索引擎长得一模一样。反过来,也正是搜索引擎的差异才构成了个体间丰富多样的独特性。
这和世界上没有两人有相同指纹、DNA的现象类似。然而人与人之间搜索引擎的不同,无疑要远远大于指纹或DNA之间的不同。为什么呢?因为我们从历史上经常看到人类因认知不同(往往又起始于大脑搜索引擎的不同)而大动干戈甚至绵延成世仇,却从未听说过有谁因为相互间指纹、DNA的不同而打架的(特殊情况如亲子鉴定除外)。
既然拿人脑类比网络搜索引擎,那么有必要了解,一个理想的网络搜索引擎应该具备什么特征?
首先,它抓取了足够多的页面。搜索引擎的价值取决于它对互联网反映的全面真实程度。如果这种反映不够全面甚而不够真实,它的价值就会大打折扣甚至变得毫无用处。
接下来是采用何种技术来编制索引的问题。
最后,它能足够精确地处理搜索出来的结果。特别当结果的数目巨大时,如何确定搜索结果与提交问题的相关性,直接决定了搜索的质量。
说到这里,顺便讨论一下Google与百度的搜索排队问题。在谷歌的开门十件事(公司哲学)里面,第六件就谈到“可以不作恶而照样赚钱”,换句话说,“没人能通过出钱提升自己在谷歌引擎的搜索排名”。——这是谷歌的公开承诺,至于是否做到,全世界的网民都可以来监督。
再看百度,尽管百度的企业文化、使命也写入了诸如“公平、求实”的字眼。但是,我不相信有人会信,百度能在竞价排名的同时,仍保证求实与公平。与其相信这个,我倒更愿意相信猫能照料老鼠、警察开办黑社会的存在。
这些东西能给我们开发大脑带来什么启发?
最大启发是,一个人摄入信息,当首先注意信息的全面性。假使他对世界的认识不够全面,那么认识得再真实也未必有益。(还记得瞎子摸象的故事么?)所谓全面,并非指事无巨细都要逐一了解,因为人的精力倒底十分有限,又无法像计算机那样可以轻松升级。折中的办法是,认识事物应尽量从事物的全景开始,尽管得到的图案会很粗糙,但只要不粗糙到扭曲事实就无碍大局。打个简单比方,好比一个相机虽仅有百万像素,但并不妨碍用它可拍出可信的全景图来——只要还没有粗糙到把树影误认为大象的地步。另外,人的精力虽然有限,但不要忘了身边还有许许多多的工具可以利用。一个人如能善加利用一切可用的工具资源,其效果与并联多台计算机增强性能没有两样。
其次,在大脑记忆即信息存储方面,人脑不可能像计算机那样,能无差别的记住指示给它的任何东西。为什么人对有些东西只要接触一次就留下深刻印象,而有的却要反复多次才能勉强记住?这里面有许多影响因素,理解对象的难易、是否符合自己趣味、附带价值的多少等等,都是可能的原因。这些东西我简单归纳为大脑的选择性接收。选择所基于的标准,暂且归结为人类趋利避害的本性。这是人脑与电脑的本质区别,即,人是有动机的,而电脑没有。至于单纯的信息存储,和前面一样,可借助于各种工具,一张纸条,电脑,互联网,周围的人,等等,都是非常好的手段。
最后,人脑针对特定话题的信息再现排列(搜索),不妨设想是前阶段选择性记忆的自然结果