汉语,是世界上最先进的语言
汉语,是世界上最先进的语言
概述
100年前,全世界都认为汉语是婴儿语,后来才发现原来汉语是进化过的世界最先进的语言。原来在七千年前,汉语也有啰嗦的后缀和字格,后来我们把那些无用东西都抛弃了。比如用一个“了”字就把已经完成的动作表现出来了。根本不用什么现在过去完成时那么啰嗦。
语言的好坏其实取决于两个方面,第一、是不是能够用很少的记忆来掌握,第二、是不是能够在有生之年掌握到比其他人更多的知识?用一句极限的话来讲应该是:最好的语言是不学而知,但是所掌握的知识又最多的语言,或者说,学少而知多的语言。
汉语学习是先难后易,只要学会一千几百个汉字,碰到新的词语,很大机会能正确推出其大概意思。英语能吗?英语等拼音文字,对没有学过的单词,往往只有一头雾水,而英语单词量多达数十万,这如何学得过来?
从人类文明发展的趋势看,作为表意文字的汉语,由于可以自由组合新名词新概念以至新思想, 可以容纳信息和知识爆炸的冲击,无疑将发展为人类的共同语言,用这种语言 来交流思想更加方便,更加丰富多彩。
一、从造词论
问:【为什么现在不造新汉字了?】
“电脑”出现时,汉语用了两个已存在的汉字“电”和“脑”来称呼它。而英语是创造了一个新的单词“computer”来称呼它。
其实英语也完全可以用两个已存在的单词来称呼它为“electronic brain”。
纵观互联网,英语不停诞生新的名词,而汉语好像很久没有新的汉字出现了。为什么?
答:不停地为新事物创造新字这件事,古人早就发现是个坑。现在这个坑里,还躺着几万个早已死掉、废弃的汉字标本。号称迄今收汉字最多的《中华字海》,简直就是一个超级大墓,8.5万多个汉字中,目前实际在使用的,大概连零头都不到。
在汉语的初期阶段,先秦(或更早一点,西周以前)基本上都是一种新事物或一个新现象就造一个单义字。据统计,甲骨文和金文当中,单义字占了85%以上。
大约从秦汉开始,汉语就已经开始从以发展单字为主,转变为以发展“词组”为主。也就是说,“尽量少造新字,努力多合成词组”,在两千多年前就这么干了。最终形成了汉语“基本字相对较少,而词汇量相对较大”的局面。这是汉语的一大优势。
以颜色词为例:
汉代以前,同一种基础色的不同深浅都会有专门的字来表示。
比如“赤”,由浅到深,分别是:
縓,《尔雅·释器》:“一染谓之縓。”郭璞注:“今之红也。”
赪,《尔雅·释器》:“二染谓之赪。”郭璞注:“浅赤。”
纁,《尔雅·释器》:“三染谓之纁。”《说文》:“浅绛也。”
朱,《诗经·七月》:“我朱孔阳。”毛传:“朱,深纁也”。
赤,《易·说卦》:“困于赤绂。”郑玄注:“朱深曰赤。”
绛,《说文》:“大赤也。”
布料每染色一次,出来的颜色都有不同的字对应。
“赤”还比较好理解,最夸张是“白”。
古人认为不同物体“白”的性质不一样。
比如,人长得白和月光的白,就得用不同的字来表示:
皎,《说文》:“月之白也。”
曉, 《说文》:“日之白也。”
皦,《说文》:“玉石之白也。”
晳,《说文》:“人色白也。”
㿥,《说文》:“鸟之白也。”
上面这些还只是基础色。
另外还有间色,也就是两种颜色混合在一起,这些字就更多了。
比如:
緅,青赤色
绀,深青扬赤色
玄,黑而有赤色
缇,丹黄色
缊,赤黄间色
黪,浅青黑色
黝,微青黑色
黤,青黑色
䵋,青黄色
䵌,赤黄色
䵎,黑黄色
黇,白黄(浅黄)色
同样的情况还发生在“马”的身上。不同颜色的马都有自己的专有名词。比如:
骠,黄偏白色的马
骊,深黑色马
騩,浅黑色马
駽,青黑色马
骍,赤红色马骝,红马黑尾
骆,白马黑尾
騢,有杂毛的红马
没完没了……
然后,所有人都发现,这条路根本行不通。因为,汉语是一个字一个音,字越来越多,同音字也就越来越多,会绕晕。人的脑容量也有限,这么搞下去,人迟早把自己累死,有限的生命都浪费在认字上了。
所以,到了唐代,上面提到那些颜色字(包括颜色马)大部分都已经废掉了,人们开始改用前缀“定语”的方式来命名颜色。仍以“红色”为例。
在唐诗中出现过的“红”包括:
薄红、大红、淡红、霏红、粉红、焦红、嫩红、浅红、深红、熟红、微红、殷红、鲜红、桃花红甚至还有一些带感情色彩的红色组合,比如:
愁红、惆怅红、寂寞红、娇红、旖旎红、慵红
同样的,诗人们还创造出:
萧条绿、愁绿、急绿、慢绿、恨紫、闷翠、生碧(对应熟红)
这么一来,不仅丝毫不影响词义的表达,而且因为组字灵活,还能够产生更多的意境之美,对文字、对文学都大有裨益。先秦那种玩法注定要被抛弃……
当然,秦汉之后,包括现代,汉语也不是“不创造新的汉字”了,只不过数量越来越少。比如“账号”的“账”,是唐代以后才产生的。再比如,国际上新合成的四个化学元素Nh、Mc、Ts、Og,它们的中文命名方案2017年才完成,是四个全新的字。
但整体上讲,“不停地造新字”这个坑,古人已经挖得很大了。可以再造8万个字出来,但我们记不住哈。
二 从音论
语言有个特点,声音种类越多,思维速度就越快,汉语的声音种类远超英语,使得汉语的思维速度比英语快。
普通话有21个声母、35个韵母和四声,连乘的结果是2900个声音,其中能够被利用的是2500个,而真正被用到普通话中的约1200个。而英语是20个元音和20个辅音,所以英语的声音种类不会超过20×20=400个。
更明显的例子是日语与汉语的对照,我们知道,日语使用了100种不同的声音,而汉语使用了1200种声音,因此很多汉字让日本人一念就必须用两个或者三个声音来表达,在花同样的时间和精力情况下,日本人能够享受到的信息仅仅是中国人的一半以下。我曾思考过,这是否是日本历史上从来没有出现过伟大的思想家的原因之一。
我们知道,思维实际上是一种心里说的过程,如果在说话时表达得快,那么,思维的速度也应该跟着快。具体的例子就是比较用英语和汉语背诵乘法口诀的速度,汉语使用了30秒,而英语使用了45秒。这也证明了使用发音种类多的语言比使用发音种类少的语言思维速度快。
一个例子是古希腊人对古菲尼基人的碾压。希腊的文化来自古菲尼基人,菲尼基人仅仅使用了22个辅音,这样,它的表达速度比现在任何语言都慢,而希腊人则增加了元音,元音与辅音结合以后,声音种类等于增加了好几倍。由于声音种类的突然增加使得希腊人的思维突飞猛进,有了后来的文化大发展。还有一个,在讨论尼安德特人的时候,人们也发现,使用声音种类少的人种会被历史淘汰。
我之所以认为汉语必定战胜英语的根据关键在于,要解决人类目前所面临的知识爆炸问题。目前的英语单词包括各种生物名称及专利发明的新术语已经超过了数百万,需要记忆的也有一百万个。而所有这些单词在汉语中都可以用四千个汉字来表达。根本的原因还是英语的发音种类不够。
比如pork这个词,在英语中代表猪肉,它和猪pig、肉meat没有任何关系,仅仅代表它们的一个联合体而已,如果把猪肉pork、羊肉mutton、牛肉beef、猪油lard、羊油suet和牛油talon放在一起进行比较的话就发现,英语中所有的联体词都是一个与其中任何一个分解词毫无关联的新符号,而它们却构成了英语词汇的主体,英语中几百万的单词就是这样来的。它的根本原因是由于如果将pork改成pig和meat连在一起的形式,那么就要发音四次而pork仅仅发音两次;所以联体的词能够节省发音却要增加记忆,而分体的词,无需记忆可是却增加了发音次数。设想,一位屠夫,每天要用到'猪肉’这个词上千次,使用两次发音的单词要比使用四次发音的词节省两千次发音,何乐不为?但是遇到不常用的词的时候,英语还是和汉语一样,使用分解的词,比如驴肉就用donkey meat来表达。因为不常用的词,即使设立了符号形式,别人也记不住。汉语能够将英语中联体词汇分解,这个功能非常有用,它使所需要记忆的词汇大大地减少。
不仅如此,它还能够将词汇在人们头脑中的位置整理得清清楚楚。达尔文主义的诞生就是建立在林奈的双名法的基础之上的,这种方法使得各种印象在脑子中由原来的平面,变成立体的。比如,在林奈以前,人们给所有的生物一个名字,结果,由于种类太多,同一种生物可能有两种名字,而另外的生物,可能没有名字。林奈则将所有的生物先分类,并且给出一个类名,然后在类名的下面放一个词,两者组成双名法的名字。这样不但清晰,而且大大的减少了需要记忆的符号;比如原来有一万个名字,现在分成一百个类,又在每类中分成一百种,我们所需要记忆的仅仅是一百个类名和一百个种名,共二百个,而不是原来的一万个。随着知识爆炸的问题逐渐恶化,人类就有必要将其他的术语也仿照这个方法改造,而目前唯一的办法就是按照汉语的结构进行改革。而原因还是在于发音种类的数量。
这个现象最先是德国的莱布尼兹体会到的,他认为汉语是自亚里士多得以来,西方世界梦寐以求的组义语言。但是,他没有看到声音的真正特性,却由于汉字的数量上的性能而定义汉字是世界上最先进的文字。我想,如果他看到今天知识爆炸的世界,他一定会要求世界上所有的国家废除拼音文字而采用汉字。
最后,谈一下关于人的一生中到底能够记住多少单词或符号的问题。中国人所使用的汉字通常在三到四千,而莎士比亚时代的英语仅有三万个单词,他本人能够全部掌握。但是到了丘吉尔时代,他的单词量依然是三万个,可是那个时候的英语已经拥有近百万个单词了。英语的单词已经远远超过了常人的记忆极限。
由于英语的思考范围狭窄,所以欧美人不能够从更加长远的利益来考虑问题,拯救他们的方法只有重新选择一门带有“声调”的语言。他们一般搞不懂什么是'声调’,所以,只好用唱歌时候的音阶来向他们解释;任何一个英语'音节’都可以跟随音阶变化出至少八种不同的声音。
三、信息熵
研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,汉字是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9乘法表,二进制只需要学会与、或、非的简单逻辑。
这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。现代英语为了应付不断涌现的新事物、新思想、新科技、新概念,也在不断地造词。无非是借助拉丁词根、或重新组合已有单词,结果越是专业科技的词汇,就越长、越难记。或者是大量使用缩写:如WTO、FBI、IBM、UFO等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。这就是汉字字符集信息熵高的优势。
四、感叹
英文真是笨人的语言,试图给天下每一事物起一个名字。宇宙无穷,英文词汇无穷!词汇如“光幻觉”、“四环素”、“变阻器”、“碳酸钙”、“高血压”、“肾结石”、“七边形”、“五面体”都只有专业人士才会。根本不可能象汉语那样触类旁通,不信?去亲自问问母语是英文的人好了。怪不得英文世界里专家那么多,而且都那么自信;是啊,一般人连他们的基本术语如“酒精绵球”“血压计”都不会讲。生活在英文世界真是对无知无奈,可悲可怜!
英文是一维的,是密码语言。写英文是编码,读英文是解码。细想想:如把英文的a、b、c、d、e换成1、2、3、4、5,并没有什么原则上的区别。按上边的对应,如一开始就把cab写成312,用一样的读音,又有什么不可以?汉语就不同了,是二维的(纸面上的最大维数),最大限度地利用了纸面的几何空间。每个汉字就是一幅画。试问从一幅画上得到的信息快,还是从一行密码中得到的信息快?
国家汉字的扫盲标准是1500个字,理工科的大学生一般掌握2000个汉字。就凭这2000个字,大家可以读书、看报、搞科研。可在英文世界里,没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随者英文新词,例如火箭ROCKET),计算机(COMPUTER)等,可汉语则无须,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-RIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。
目前,英文词汇已突破40万,预计本世纪中叶,将突破100万大关。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。
当今虽是英语文明的蓬勃期,但在历史的长河中,So far,英文世界的文明史远比汉语世界的文明史短。
(摘自北大中文论坛苏诚忠及微博“书肆巡阅使”)