“它只是改变了人们认为生物学可以实现的方式。”

2003年4月14日,科学家宣布完成了历史上最了不起的成就之一:首次(几乎)完成人类基因组测序。这是全球数千名科学家历经十多年努力的结晶。许多人希望这一成就能让世界变得更好。

在这一历史性事件20周年之际,我们回顾了人类基因组计划及其影响。那么,它是如何影响科学发展的呢?从那以后,有多少预期目标已经实现了?遗传学研究的未来是什么?

基因组是组成有机体的全部遗传信息。这些信息被包装成我们称为“基因”的DNA序列,在人类中,这些基因分布在23对染色体上。虽然,这些基因中只有一小部分包含编码生命所必需的许多蛋白质的指令,但其余的大部分仍然被认为对我们的功能至关重要。正如科学家最终证实的那样,人类基因组的一个副本有大约30亿碱基对的DNA。参与该项目的研究人员并没有忽视绘制所有这一切所需的巨大努力,特别是考虑到几十年前的技术。

“人们做了很多类比,比如我们是刘易斯和克拉克。我们没有真正的地图,”德克萨斯州贝勒医学院人类基因组测序中心的创始人兼主任理查德·吉布斯(Richard Gibbs)说,该中心是参与该项目的主要机构之一。

吉布斯和他的许多同事都知道,他们必须做出妥协。尽管自1990年该项目正式启动以来,测序技术取得了进步,但他们无法用现有的工具填补所有空白。第一个人类基因组是由美国的几个献血者组成的,而不是一个人。与此同时,私营公司赛莱拉(Celera)也加入了这一行列,该公司承诺将用自己的技术更快地完成一个单独的基因组项目。最终,两组团队几乎同时提前完成了任务,在2000年发布了第一个序列草稿,尽管 Celera 在几个月前宣布了它的成功。

无论谁是胜利者,这项壮举无疑开创了一个遗传学研究的新时代 —— 一个自2003年以来在速度和效率上都有巨大飞跃的时代。

“我认为过去20年最重要的成就是新一代测序技术的出现。以大规模并行的方式进行测序的能力,这样你就可以更快、更便宜地进行测序,”麻省理工学院和哈佛大学布罗德研究所基因组学平台主任斯泰西·加布里尔(Stacey Gabriel)说,该研究所是参与人类基因组计划的另一个主要研究机构。“这也伴随着我们计算能力的所有相关进步,我们真的能够获得这些数据并进行大规模分析。”

上图:Illumina 公司的测序仪发展历史。

最初的项目耗资27亿美元,大部分基因组的绘制时间为两年。目前,基因组测序的最快速度纪录是5个小时左右(但更多时候需要数周)。去年秋天,Illumina 公司推出了一款机器,据称每组测序的成本将低至200美元,而最近的典型成本为600美元。

格雷格·芬德利(Greg Findlay)是英国弗朗西斯·克里克研究所基因组功能实验室的负责人。他的团队是世界上众多在原项目基础上进行工作的团队之一。他们目前正试图识别和理解,肿瘤抑制基因的某些变异是如何增加我们患癌症的风险的。

“所以,我的实验室试图做的实际上是了解变异对基因组的影响。也就是说,我们想确切地知道哪些变异会导致疾病,以及它们为什么会导致疾病。现在,我们关注的是导致癌症的某些基因变化,我认为人类基因组计划确实在这个特定领域发生了革命性的变化。我们现在知道,细胞可以通过许多不同的遗传途径转化为癌症。我们知道这一点,因为我们已经能够在所有不同类型的癌症中重复对许多不同肿瘤的DNA进行测序,看看到底是什么突变导致了癌症的形成。”

也许同样重要的是该项目对科学合作的影响。这项努力直接促成了一项旨在确保公开获取 DNA 序列的国际协议。理查德·吉布斯说,这也清楚地表明,当大批科学家一起工作时,伟大的事情是有可能发生的。

理查德·吉布斯表示:“它只是改变了人们认为生物学可以实现的方式。它为团队科学建立了一个以前没有的模型。”

在当时,这个项目也故意留下了一些未完成的东西。到2003年,他们已经绘制了大约92%的基因组图谱,但其他科学家却花了近20年的时间来追踪剩下的8%。我们基因组中缺失的“暗物质”很可能为人类如何进化,或我们对各种疾病的易感性提供新的线索。

项目结束后收集和分析的大部分基因信息都来自白人和欧洲人 —— 这种差异阻碍了我们真正了解基因对每个人健康的影响。但如今,科学家们正致力于通过“人类泛基因组计划”(Human Pangenome Project)等计划来弥合这一差距。该计划将对300多人的完整基因组进行测序并提供信息,以代表全球人类多样性的广度。

“世界上所有的人群都存在基因变异。如果你只使用世界上一小部分人口的变异,并试图将其应用到其他所有人身上,那就不太管用,因为我们都有不同的背景,”该项目的协调员之一、圣路易斯华盛顿大学麦克唐奈基因组研究所项目开发和新举措主任露辛达·安东纳西-富尔顿(Lucinda Antonacci-Fulton)说。“所以,你的包容性越强,你就越能更好地将治疗方法引入诊所。”

与遗传学研究一样重要的是,人类基因组计划引发的一些期望可能太高了。例如,2000年,美国总统比尔·克林顿(Bill Clinton)声称,该项目将“彻底改变人类大多数(如果不是所有)疾病的诊断、预防和治疗”。虽然,我们仍在继续发现新的基因变异,这些变异可以强烈预测患上某种特定疾病或特征的几率,但是,还有无数其他的基因变异我们仍然一无所知。在其他地方,很明显,我们的基因组在我们生病或以特定方式经历某些事情的原因中,往往只起到很小或可以忽略的作用。因此,尽管该项目帮助解开了世界上的一些奥秘,但关于我们为什么是这样的,还有更多的问题,而我们的基因可能无法为其中许多问题提供一个简单的答案。

斯泰西·加布里尔指出:“我认为,有时候,事情被夸大的地方在于,仅仅因为人类基因组已经完成,你就可以把它读出来,得到某种确定性的答案,在这种情况下,找到疾病基因就像从木头上掉下来一样简单。但是,通常人类疾病,尤其是对我们影响最大的疾病,都不是简单的遗传疾病。它们是多因素的。它们是你的基因、你的行为、暴露在环境中的组合,有时只是运气不好。

当然,这并不是在低估遗传学的潜力。汉斯·莱拉赫(Hans Lehrach)是德国马克斯·普朗克分子遗传学研究所的前主任,是最早参与人类基因组计划的研究人员之一。他也是许多科学家中的一员,他们相信有一天我们能够廉价、轻松地在一瞬间扫描一个人的基因组,这些信息,以及我们分子构成的其他方面,将有助于指导医生开出的特定药物或干预措施 —— 这就是所谓的个性化医疗。值得注意的是,一些癌症的治疗已经受到其生长基础变异的影响。一些专家甚至认为,广泛的全基因组测序应该在出生时就开始,美国、英国和其他地方已经有了小规模的项目,测试其潜在的好处和风险。

汉斯·莱拉赫表示:“不知道自己的基因组就有点像过马路时闭上眼睛,因为你不想看到公交车开过来。如果我们不对基因组进行测序,公交车就会一直来,这只会让我们睁开眼睛,也许能看到我们可以逃离或做些什么的那种危险。”

人类基因组计划确实改变了科学的格局,但我们仍然才刚刚开始看到它所带来的世界。