迄今最全面人类基因组测序完成:新增了2亿个碱基对和2000多个基因
来源:中国数字科技馆
【观展信息】庆祝建党100周年中国载人航天互动科普展:3月18-6月10日,由中国科技馆主办的“庆祝建党100周年中国载人航天互动科普展”正在展出中,热爱科学的你,快来打卡吧!
2001年,赛莱拉基因组学和国际人类基因组测序联盟(Celera Genomics and the International Human Genome Sequencing Consortium)公布了他们的人类基因组初稿,读取了一个人的全部脱氧核糖核酸(DNA)——这给基因组学领域带来了一场革命。

可惜的是——虽然这些草案和随后的更新有效地覆盖了基因组的全染色质部分,但异染色质和许多其他复杂区域却仍未完成或存在错误。
而近日,美国端粒对端粒(T2T)联盟的科学家们完成了第一个真正完整的30.55亿碱基对的人类基因组序列,这是自人类参考基因组首次发布以来最大的进步。科学家终于可以从头到尾读取人类的全部基因组了!

人类拥有数万个基因,它们储存于DNA分子中,基因信息以4种碱基(C、G、T和A)的形式存在,两个碱基相互配对形成碱基对。与此前结果相比,新结果增加了2亿个碱基对以及2000多个基因,并纠正了许多错误。
研究人员选择从一个被称为CHM13的细胞系中读取DNA,它可在实验室中培养,因此不是任何人的基因组。新完成的区域包括所有的着丝粒卫星阵列(centromeric satellite arrays)和所有五个端粒染色体(acrocentric chromosomes)的短臂,首次将这些复杂的基因组区域解锁到变异和功能研究中。

为组装基因组序列,研究团队利用了两种技术:一种是能读取非常长(超过100万个碱基对)片段的测序技术;另一种是精确度极高、能处理差别极小的片段(比如同一个基因的多个副本)的技术。
总结来看,这些科学家们描述了第一个真正完整的人类参考基因组的构建、验证和初步分析,并讨论了其对该领域的潜在影响。这些最新的进展发表在生物预印本网站(biorxiv)上。