[转载]《语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方》新闻
查明白了,我们的语言“北方起源假说”被证实!
一些研究依据考古学、历史学的发现认为,早在人类鸿蒙初醒时期,受战争、天灾等因素影响,人类迁徙,在这一过程中,语言也传往新的居住地,并于当地的原住民的语言相融合,形成了汉藏语系的不同语族、语支。
但这些都是猜想,长期缺乏科学证据证实这些猜想的正确性。近日,复旦大学金力院士团队宣布,综合运用语言学和遗传学等多学科交叉的分析方法,揭示了汉藏语系在新石器时代晚期起源于中国北方,汉藏语言大概在5900年前分开。
4月25日,相关结论以《语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方》为题,在线发表于《自然》杂志。这是中国语言学研究领域首次在《自然》杂志发表科研成果。
汉藏语系起源存争议
汉藏语系是什么?语言学家一般认为汉语、藏语、缅语、羌语等存在一个共同祖先,统称为汉藏语系,这些语言有很多词汇,尤其是一些基础名词、亲属关系词、助词等的基本词汇同源,比如“日”,古汉语读“nit”,汉语读“ri”,藏语读“ni”,缅语读“ne”。在23日召开的《自然》电话新闻发布会上,该论文共同第一作者、复旦大学人类表型组研究院助理研究员严实介绍。
“‘人类从哪里来’之于哲学,就像汉语言的起源之于中华民族。”上海师范大学教授、复旦大学人文社会科学数据研究所东亚语言数据中心负责人潘悟云说,语言是文化的重要载体,由于中华文明史历史渊源深厚,历史资料缺乏,系统认识语言起源一直是研究界热衷的难题,也存在诸多争议。
一直以来,语言学家对汉藏语系内部各语支亲缘关系、分化时间以及起源地点长期存在争议。“北方起源假说”认为汉藏语系起源于大约4000—6000年前中国北方的黄河流域,而“西南起源假说”则认为它起源于至少9000年前的东亚西南部某地。
金力研究团队早在十几年前,研究团队就用依托遗传学数据和分析手段,研究汉藏语人群的起源,以及汉语和藏缅语族人群的关系,初步证实大概在约6000年前汉语人群与藏缅语人群分开。但由于当时采样量的限制,加之东亚群体活动的丰富性,结论的普适性有待进一步扩大。
该论文通讯作者、复旦大学遗传工程国家重点实验室、生命科学学院人类遗传学与人类学系教授、中国科学院院士金力表示,研究人员希望借助语言学的材料,用遗传学方法系统分析汉藏语系各语言,共同回答汉藏语人群的演化、汉藏语系起源等问题。
将6000年精确到5900年
从2016年开始,金力院士团队对109种汉藏语系语言的近千个词汇词根-语义组合进行了收集和整理,并进行谱系建模,重构了汉藏语系诸语言间的亲缘关系,以此推算汉藏语系的分化时间和起源地。
该论文共同第一作者、复旦大学现代语言学研究院青年研究员张梦翰表示,语言是研究群体演化和文化演化的桥梁,此前借助遗传学的数据及研究方法只回答了不同族群的人群差异问题,此次研究团队希望引入数理统计方法,回答不同族群间语言差异的演化关系和模式问题。
研究人员摒弃了传统的语言年代学认定方法,采用贝叶斯系统发生学分析方法,先后推翻了3次实验模型,以期找到最准确、最科学的研究方法,最终认为,原始汉藏语分化成现代语言的最早年代在距今约5900年前,地点可能在中国北方。严实表示,该研究的结论支持了东亚地区汉藏语系诸多语言的同源关系,证实了汉语从原始汉藏语分离成独立语族(支)的观点,并且汉藏语系中的其余语言构成一个单系语言群,即为藏缅语族。
为了印证结论的科学性,研究人员又参照考古、历史、文化等的相关证据,发现汉藏语系的起源和分化对应仰韶文化的晚期、马家窑文化的早期,也符合语言随农业扩散的观点,而且扩散的时间点与考古证据相符——此前的考古证据揭示出独特建筑形式和陶器类型向南扩散的特征,进一步证实了北方起源假说的科学性。
新文科建设研究范式初现
值得关注的是,本研究涉及的语言主要包括汉语和藏缅语族诸多语言,潘悟云介绍,同源语素是语言的“基因”,“基因”的广泛性影响结论的普适性,该研究只是一个开始,未来的研究有望进一步扩充材料与同源词的认定数量。
据了解,目前研究团队已开发出同源语素的切分及认定软件。潘悟云表示,这是现代技术对语言学的贡献,接下来,研究团队将关注汉语言研究中更为复杂的问题——方言的形成过程。“该研究还原了古人说话的部分语音,现在人类已经可以用唐朝的语音语调诵读李白的《蜀道难》,未来用春秋时期的语音语调朗读孔子的《论语》可期。”说。
谈及该研究的价值,金力表示,该研究不仅为探寻中华文明的起源和发展历程,了解中国及周边邻国的各汉藏语系语言之间的演化关系提供了重要依据,为认识东亚人口迁移历史提供了重要启示。其研究方法综合运用了语言学和遗传学等多学科的知识,促进了传统的语言学与计算机科学、脑学科、人类学、心理学、医学等学科的交叉融合,将为新文科建设拓展新的前沿领域、开创新的研究范式。
语言学家热议《Nature》汉藏语系起源!
4月25日,《自然》(Nature)杂志首次刊登中国语言学研究成果——《语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方》。
本论文由复旦大学金力院士团队完成,综合运用语言学和遗传学等多学科交叉的分析方法,揭示了世界第二大语系汉藏语系起源及分化的时间和地点。该研究为探寻中华文明的起源和发展历程,了解中国及周边邻国的各汉藏语系语言之间的演化关系提供了重要依据,为认识东亚人群迁徙历史提供了重要启示。
汉语、藏语、羌语、缅语等400多种东亚语言被认为拥有共同的祖先语言,合称为汉藏语系。该语系是世界第二大的语系,母语使用人数仅次于印欧语系。一直以来,语言学家对汉藏语系内部各语支亲缘关系、分化时间以及起源地点长期存在争议。“北方起源假说”认为它起源于大约4,000–6,000年前中国北方的黄河流域,而“西南起源假说”则认为它起源于至少9000年前的东亚西南部某地。
复旦大学金力院士团队通过对109种汉藏语系语言的近千个词汇词根-语义组合(root-meaning)进行谱系建模分析,历时两年多,重构了汉藏语系诸语言间的亲缘关系,并以此推算了汉藏语系的分化时间和起源地。该研究支持了东亚地区汉藏语系诸多语言的同源关系;证实了汉语从原始汉藏语分离成独立语族(支)的观点,并且汉藏语系中的其余语言构成一个单系语言群,即为藏缅语族;估计了原始汉藏语分化成现代语言的最早年代在距今约5900年前,地点可能在中国北方,因此该语系的起源和分化可能与仰韶文化及马家窑文化的发展有着密切的关系。以上发现与“北方起源假说”相符,也符合语言随农业扩散的观点,而且扩散的时间点与考古证据相符——此前的考古证据揭示出独特建筑形式和陶器类型向南扩散的特征。
国内语言学家评论
齐冲
巴黎第七大学教授
这个研究结果从某些方面证明Starosta(2000)对原始汉-藏-高加索语的假设,也部分支持了他对中国远古小米和大米两个不同农业区域的划分。有点儿偏离“主流”,确实出人意料,但很刺激。希望今后也能在Nature上看到论证汉藏和南岛语发生学的文章。
金立鑫
上海外国语大学语言研究院教授
金力他们的研究与“汉藏同源——因此造成汉语VO-OV语序混合以及汉语中存在大量施通格句法配置”理论一致。(藏语是施通格语言,藏语也是OV语言)。
李葆嘉
南京师范大学语言科技研究所教授
关于历史比较语言学与分子遗传学的合作研究
1. 进化生物学的贝叶斯系统发育方法,对概率的理解是人们对某些事件的一种信任程度,是对事物不确定性的一种主观判断,与个人因素等有关,故称之为主观概率。
2. 历史比较语言学与分子遗传学的合作应该建立在各自独立成果基础之上,不宜拿语源单位当作基因直接套用数学模型(贝叶斯系统发育方法)做数学分析。基因中的0和1是从有机物质中分析出的,而语源单位是否相同的这0和1是人为判定的。
3. 人类分子生物学和史前语言人群分布可以交叉研究,但这种探源性研究与依据语言资料比较有别,因为史前语言人群没有留存当时的语言资料。这种研究应当明确为语言资料历史比较和人类分子生物学之间的映射研究。
4. 也就是说,务必区分有文献比较和无文献探讨之间的区别。语言历史比较是本证,其他都是参证(分子生物学、人类体质学、考古文化学、历史文献学、民族文化学等)。当然,参证也有不同程度的价值。
5. 有些方法看起来很精密,其实精密方法的背后却存在若干模糊。比如说,关于语言比较的几十个义根单位,它们各自最早出现于什么年代,它们之间那些是各自本有的,也就是从远古继承下来的,那些是外来的,即通过接触借来的。如果这份资料没有严格鉴定,那么接下来的所有模式比较都可能增强主观性。
6. 生物学的谱系树不宜机械搬用到语言历史比较研究中来,因为语言的发展是多向交叉。一般而言,它不是一个以主干为分叉的简单谱系树模式(印欧语系是个特例,而且并非纯粹的特例。更为纯粹的特例是闪米特语系),而是一个复杂的多向交叉方式,通过人群迁徙、文化接触和异群通婚等一系列社会活动而导致语言变化。如果一定要建谱系树,那么应当是多维交叉型谱系树。
7. 关于汉藏语言在中国北方出现,并在大约5900年前开始分裂。这种主观概率或或然性假说,并没有超过美国帅德乐(Stanley Starosta, 1939-2002)2001年提出的“原始东亚语群说”的范围。
8. 汉语的形成,这里主要是指夏商周三代华夏语的形成,并不是简单的汉藏语分家。或者说,“原始汉藏语”也只是华夏汉语来源的一部分。否则语言学家也就不会提出汉-欧同源说、汉-高(高加索-叶尼塞)同源说、汉-阿(阿尔泰)同源说、汉-乌(乌拉尔)同源说,也就不会提出汉语与南岛语或南亚语具有亲缘关系。因此汉语的形成是复杂的,如果仅仅将目光放在西部,放在黄河上游(汉藏同源说),而不关注黄河中下游以及长江流域,那么华夏汉语的起源是讲不清楚的。
附:@四毋斋(洪波)近年来的语言接触研究表明:两个操不同语言的族群如果在较长时间内保持相对单向的通婚关系,则逐步形成一种混合型语言,该语言基本保持着父系族群语言的词汇,而主要继承母系族群语言的形态句法。基于此,语言亲缘关系就不能单方面只考虑词汇,反之亦然。金先生及其团队的工作最多只能证明在词汇上汉语跟藏缅语关系更密切。七世纪藏文所反映的藏语形态跟春秋战国时期文献所反映的形态有些有着高度的平行关系或一致关系,我们认为这种平行关系或一致关系较难推嬗到原始共同语时期,更有可能是周人窜于戎狄时期所获得的,然后带到上古汉语当中的。
洪历建
澳大利亚莫纳什大学教授
语言既然是历史与社会的产物,自然也可以从语言和语言的变迁中找到历史与社会的变迁。(不过)在此之前的人又是从哪里来?说什么话?
刘祥柏
中国社会科学院语言研究所教授
遗传学数据是否有利于弄清楚语言发生学的来龙去脉,很让人疑惑。不知道结合遗传学的数据,能不能测出来一个长江流域的汉族人有朝一日会说一口流利的洋泾浜英语。语言可以被和平地或者暴力地彻底替换,遗传信息似乎不容易被大规模彻底替换。
曲卫国
复旦大学外文学院教授
研究通过对109种汉藏语系语言近千个词汇词根-语义组合的谱系建模分析,重构了汉藏语系诸语言间的亲缘关系,真的觉得非常伟大。只是我不太理解,谱系关系对汉藏语系分化时间和起源地的推测能提供神马依据?最早的甲骨文好像是三、四千年前的事情。再早就没有文字记录了。这只是汉字,不知其他108语言的文字记录有多早,难道都有三千多年前的文字形态?凭晚一千多年的文字残片所形成的谱系关系就能推导出距今约5900年前的文字分布和关系?而且确定地点?这依据真是高深。后悔恢复高考时没学理科了,跟不上节奏。不懂啊,到了这把年纪,学习也不可能了。感觉现在深陷批评理论的蜘蛛网,成天神经兮兮滴疑心。
高雪松
新西兰奥克兰大学教授
应该这么说,他们其实是按照他们行业里可以接受的规则做的研究,至于到底是不是这样,天晓得呀。就像那些天文学家,根据一个小点pixel来说这是个全部被水覆盖的行星,在几百万光年之外。当然到底是不是这样?天晓得呢。所谓的科学研究,也就是根据行业接受的规则进行的大胆想象而已。
华学诚
北京语言大学人文学院教授
一切的探索都是可贵的,学科交叉研究是一个重要方问。但发表了文章,并不等于就是定论。纯粹从语言学的角度考虑,该研究项目所采用的材料是否具有同质性(比如如何保证“同源词”都是真实有效的,而没有混入借词),所采用的各语种材料是否具有共时性(很多语言根本无法提供古代材料,好像藏语的古籍资料也早不过唐代)……这些都是从事这类研究在语言学上的难题,如果他们的研究未能在这些方面有重要突破,结论的可信度有多大,现在还很难说。
徐默凡
华东师范大学中文系副教授
是的,涉及的变量太多,牵一发而动全身,一个数据有问题就可能产生蝴蝶效应,导致结果偏差。我觉得他们主要是用不同民族的遗传学基因测定来做的,语言学证据只是辅助,所以才发在《自然》上。
来自:https://mp.weixin.qq.com/s/nseZOlCSQ7pZ_A89SZbzew
潘悟云接受采访视频见:http://n.miaopai.com/media/10MDcoftMCHmhAIYrV5FymjO~VsDAagf