为什么汉字顺序有时候不影响阅读?
引: 要理解不影响阅读的原因,就必须要先了解“阅读“时我们的大脑经过了哪些步骤,这些步骤里哪些影响了我们的阅读结果。下面我将简单的聊一下:
前些天我在广播发布了一个打乱中文语序的桌面工具“混淆一下”(在@gardenia 的基础上),因为@nullpointer 的推广,用的友邻也很多,它的效果如下:
输入原文:最近在家太无聊我一天到晚在吃鸡
输出结果:最近家在无太聊我一到天吃晚在鸡
如果你读明白了这句话,说明中文语序错乱是不影响你的阅读的。

那么语序错乱为什么不影响阅读呢?
这是中文独有的么?
任何句子语序打乱都不影响阅读么?
“看见“的过程
首先,这不是中文独有的现象。至于为什么不影响阅读,我们需要先理解“看“这个动作是怎样运转的。
第一步:人眼看到内容,即看。此时需要适当的光。
第二步:感知深度。视觉系统对大量线索进行加工来推断距离。视觉计算领域的戴维马尔在1982年提出这种感知深度介于二维与三维之间,即2 1/2维简图。
第三步:感知空间。我们将一些线条一些色块整合成对三维空间的理解。我们的透视法“近大远小”正是对这一感知的反映。
第四步:根据情境与认知,识别物体/信息,即识别。此时我们脑中已有看见的原始信息和经过视觉系统进行初加工后的信息,大脑需要做的就是识别。

看?如何看?
阅读,是”看“的延伸。
阅读的本质是,视觉看见文字/字符,识别其中的意思。
实际上,阅读的过程中,在第一步“看”的时候,我们接受到的信息已经不能等同于原文信息了。
由于人类视网膜生理结构特点,阅读时视野在不停的快速移动,移动时无规律的停留去完成注视,即眼跳(saccade)+注视(fixation)。眼跳时视觉精度下降,几乎获取不到任何有效的视觉信息,获取视觉图像细节的过程实际交给了视野注视。[1]
我们对物体和场景的视觉感知是通过一系列的注视和眼跳来完成的。
研究人员使用眼动仪研究了成人读者阅读的眼动轨迹,结果如下图所示:黑点代表注视点(fixation)位置,旁边的数字代表每个注视点的持续时间,实线箭头指向表示眼跳(saccade)方向,虚线箭头指向回视(regression)方向。[2]

根据上图看出,眼睛注视点为数个跳跃点,不管这个句子是正常语序还是语序打乱,眼睛“看到”的都是少量词汇,而不是一整句话。
也就是说,当你快速通读时,你的【看】更类似于扫视,扫视时会选择性的【看见】一些词汇,以便大脑的后续处理。
第二步“感知深度”和第三步“感知空间”对于识别文字作用不大,不再赘述。
如何识别这些文字的具体含义,就是第四步“识别”的工作范围了。
先识别单个文字
识别句子先理解如何识别单个文字。
一些心理学家提出,我们识别单个文字是通过特征分析(feature analysis)实现的。这个“特征”即是字形的特征。
下图是日本设计师野村一晟为日本赛艇比赛做的设计海报。正着看是“最强”和“挑战”,倒过来看就是“战场”和“胜利”。他通过对字形的重新设计达到了正看和倒看截然不同的效果。
仔细看这几个汉字,很容易发现这几个字比常规的书写多了一些赘余的笔画。笔画多余却不影响识别,正是因为我们对这几个汉字的字形有了理解——这些汉字最核心的形态特征存在,就不会影响我们阅读。就像火星文不影响阅读一样。

这些特征在一定程度上只是些线条和笔画,然而同样的线条组合,人类可以识别为某个文字,机器却不能,这说明人类的“识别”还远远没有被规则化。我们在登录某些网站时遇到的文字验证,也是利用了人和机器的识别差异。

一个题外话:图像识别领域的专家们仍在致力于找到人类识别的规律,我们可以进入CAPTCHA的网站,完成简单小测试来为他们的研究做出贡献。
识别整段文字
识别并非简单的对单个词汇逐一辨认,识别整段文字隐藏一个潜在的逻辑:理解。
理解文字需要考虑到上下文,或者其他的相关的信息。这里利用的是情境与模式识别。
验证情境和模式识别的作用时,我们通常会用到这个例子:

我们很容易识别为”THE CAT“。可是”H“和”A“结构一模一样,为什么会被辨认为不同的字母呢?
这便是情境给予的信息帮助我们认出字母。这种“认出”不是人脑的主动推理,更像是无意识的推断。
1979年,Massaro研究了情境与识别之间的相关性。他制造了四种不同情境的句子,每种句子内都有几个位置被看起来像“c”又看起来像“e”的符号代替。
一种情境下,只有c才能构成单词;
一种情境下,只有e才能构成单词;
一种情境下,c和e都可以构成;
最后一种情境,c和e都不可以。
他向被试短暂的呈现这些刺激,并要求他们识别字母是c还是e。
当Massaro不断增加外界对该字符为e的刺激时(即外界对e的暗示增多),识别为e的概率也随之增加。这就是著名的知觉模糊逻辑模型(fuzzy logical model of perception,FLMP)。

这也解释了高中英文阅读理解时根据上下文猜生词的可行性。
情境既然可以让我们脑补出一个单词缺失的部分,也可以让我们脑补出一句话缺失的部分。就像这句:
2000年前x始皇统x中x,在x种程度塑x了x国x个多x族国x的性x的一部x。
一些心理学家认为,我们之所以能通过情境去理解句子缺失的部分,是因为文字这样的复杂刺激中本身就存在着冗余信息。
这些刺激(或者说是暗示),包含的特征远多于可以将一个单词与另一个单词区分开所需要的特征。多到什么程度呢?多到这个句子只有部分特征可以识别时,知觉也可以顺利的进行下去。
回到我们的阅读过程中,这个过程便是:
当我们通读一个句子时,先是提取了部分文字传给大脑,大脑识别出这些文字的汉字,并根据这些汉字携带了的特征,脑补出了全部信息的。
任何句子语序打乱都不影响阅读么?
一般说来,一段文字通读后没有读懂,我们会再次阅读,直到从文字中收集到足够多的特征,可以理解为止。然而有些文字,理解是有一定门槛的。
贡布里希(sir E. H. Gombrich,艺术史家)将这种理解称之为“知觉概括”,也就是人类因过往的经验学习思考而习得的潜意识的概括和理解能力。现代心理学更倾向于认为这是人类的记忆系统在发挥功效:人类学习了知识,将知识以某种方式存储于记忆中,当使用时,记忆提取、加工,再输出至人类的意识层面。关于记忆的运作和原理实在太过复杂,本文不再赘述。
不管心理学如何界定理解门槛的原理,我们普通人能确定的是:有些文字正序读起来都费劲。
那么乱序的情况下更加影响阅读了。
总之,在我们的理解范围内的句子,正常语序和乱序才不会影响阅读。
参考文章:
[2]王晓明, 赵歆波. 基于深度神经网络的个体阅读眼动预测[J]. 清华大学学报(自然科学版), 2019, 59(6): 468-475.
[3][美]约翰·安德森. 认知心理学及其启示(第7版)[M]. 人民邮电出版社
[4](英)E.H.贡布里希. 秩序感——装饰艺术的心理学研究[M]. 广西美术出版社