20年前,与“曼哈顿原子弹计划”和“阿波罗登月计划”并称为人类科学史上三大科学工程的“人类基因组计划”,完成了对人类基因组30亿个碱基对的测序。中国作为其中唯一的发展中国家承担了1%的测序任务。从此,“人类参考基因组”成为人类遗传学和医学研究的遗传密码“导航图”。

20年后,这张基因“导航图”有了中国制造的“中国版”,是首个中国人群专属的泛基因组参考图谱。6月14日,复旦大学、西安交大、中国医学科学院等26家单位联合发布相关成果于国际学术期刊《自然》。这是我国科学家独立完成的人群基因组研究首次发表在《自然》。


【构建人群泛基因组图谱的“中国画卷”】

20年来通用的人类参考基因组,主要以欧洲白人为主体样本构建,大部分DNA来自住在纽约州布法罗的一名白人男性捐献者,难以代表非欧裔族群、尤其我国族群的基因组多样性。上个月美欧国家主导最新发表的人类泛基因组参考图谱,收集了全球范围的47例样本,其中仅包含3例中国汉族样本。

悠久的人群历史、丰富的地理气候环境,塑造了中华民族独特的遗传多样性。构建人群泛基因组图谱的“中国画卷”,势在必行且迫在眉睫。

中国科学院院士赵国屏认为,在人类这个物种中,亚裔和华裔人群是一个重要的组成部分。西方发达国家尽管有大量的亚裔和华裔人群,比如华裔美国人口的数量已经达到了500多万,但在其基于基因组的生物医学研究中,亚裔或华裔族群在大多数情况下都很难排到优先级考虑。因此,不可忽视我国丰富的人类遗传资源是研究人类基因组多样性、人类进化和人类疾病相关基因的宝贵材料。

2021年1月,复旦大学生命科学学院徐书华教授、西安交通大学叶凯教授联合国内26家单位发起了中国人群泛基因组联盟,旨在形成我国自主可控的人类基因组资源与核心技术,服务人民生命健康。

联合研究团队对涵盖中国36个族群的58个样本进行了深度测序和高质量分析,构建了首个高质量中国人群参考泛基因组。


【挽回“丢失的遗传率”】

基因在什么位置?如何排列?相比过去“一维线性”的人类参考基因组,此次提供的“中国版导航图”升级为“多维”。

“这好比过去只有一条地铁线,要去哪里只能沿着这条线走。现在有了多条地铁线,形成了网络,不仅有交叉,还可以换乘。”徐书华告诉解放日报·上观新闻记者,人类的基因片段有多样性特征,以往的“导航图”只提取其中一部分特征,不仅相对“简单粗暴”,还缺失了许多关键遗传信息。

“中国版导航图”从每个样本中发现了将近70兆在传统参考基因组漏缺的新基因序列。“人类有23对染色体,最大的约250兆,最小的约47兆。这70兆的遗传信息量不小,可能蕴含了科学家一直在寻找的肝癌、肺癌、Ⅱ型糖尿病、精神分裂症等复杂疾病的遗传基础。”徐书华说,比如,有研究认为精神分裂症的遗传率高达81%,但按照过去的“线性导航图”只能找出20%的相关遗传信息,剩下的遗传因子至今没有找到。

这项研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列。不同于“线性导航图”主要考虑核心共有的基因序列,“中国版导航图”综合考虑了个性化的基因序列,这正是“泛基因组”的内涵,有了更多维的视角。这对于重构人类演化历程、挽回“丢失的遗传率”,具有巨大的潜在价值。


【最有可能连接渐变到跃变的进化密码】

“您的身上可能有大约1%尼安德特人的基因序列,大约5‰丹尼索瓦人的基因序列。”徐书华告诉解放日报·上观新闻记者,此次“中国版导航图”有些有趣的发现或印证。

比如,中国人的基因序列中有些并不是来自直系祖先,而是已经灭绝的尼安德特人或丹尼索瓦人或其他古人类。“这可能是3万年前亚洲人的祖先与之有过交集,并留存了后代。”徐书华说,研究团队对这些基因序列进一步分析发现,它们竟然与我们的指甲头发的发育、紫外线辐射应激、DNA修复、免疫反应甚至寿命等相关。

“这反映了我们的基因组中可能仍有大片有价值的矿藏尚未得到充分开采。”论文共同作者、中国科学院院士、复旦大学校长金力说。

此次“中国版导航图”新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及至少1367个蛋白质编码的基因序列。

“我想强调的是,基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个‘鸿沟’的进化密码。我相信,通过对基因组结构变异的高精度解析,不但能大幅提升‘基因型-表型’关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。”金力说。


【打破人类基因组学研究的这种“停滞”】

从承担人类基因组计划“1%”的测序任务,到中国人群泛基因组图谱“100%”由中国科学家完成,这展现了中国生命科学尤其是基因组学在过去20年间的科研积淀和历史性跨越。

人类基因组研究是基因组学中起步最早的方向,曾领先于其他物种的研究。“这种先发优势也使得人类基因组研究越来越难以取得新的突破性成果。近年来,动物、植物、非人灵长类、反刍动物等领域的基因组学研究进展很快,取得了令人瞩目的成绩。相比之下,人类基因组研究显得有所‘滞后’。而此次发表的成果,打破了人类基因组学研究的这种‘停滞’,也是我国科学家在人类基因组研究领域取得的又一重大进展。”金力说。

徐书华介绍,“中国版导航图”虽然是一个纯粹的基础研究,但一经发布立即可用,所有和基因相关的科学研究,比如人类遗传学、医学、药物基因组学等都能以此为参照。“这是纯公益的,我们正在进一步提升算法和优化参考图质量,希望未来可达成‘一键式’生成‘导航’结果。”