近日,Nature 公布了 2023 年值得关注的 7 项技术,分别是:单分子蛋白质测序、詹姆斯韦伯太空望远镜、体积电子显微镜、CRISPR、高精度放射性碳测、单细胞代谢组学,以及体外胚胎模型。5项技术花落生物医学,其中,单分子蛋白质测序更是受到广泛关注。

虽然一直以来,都是基因测序更为人所知,但今天,蛋白质测序越来越展现其对认识生物过程的独特价值。不管是基因测序,还是蛋白质测序,生物测序都已经进入快车道,并为药物研发和疾病治疗带来了新的思路。


基因测序到蛋白质测序

基因测序的出现极大地推动了生物学的发展,彻底改变了生物学的研究。今天,它已经成为分子生物学研究中最常用的技术。在许多不同的细胞环境中对DNA和RNA进行排序可以发现关于遗传病、生物发育和细胞谱系追踪等的潜在原因。从人类基因组计划,到人类基因组单倍型图计划,再到人类癌症基因组及个体基因组计划,第一代和第二代测序技术功不可没。

而近几年发展起来的第二代基因测序技术更使得基因测序进入了高通量、低成本的时代。目前,基于单分子读取技术的第三代基因测序技术已经出现,该技术测定基因序列更快,并有望进一步降低测序成本,为人类从基因水平深入理解疾病的发生、发展、诊断和治疗提供新的手段,并使个体化精准医疗成为现实。

要知道,相比于基因测序,蛋白质测序甚至更早出现,并具有相同重要的价值和意义。不管是蛋白质测序,还是基因测序,都离不开一个人,那就是弗雷德里克·桑格。1918年8月13日,桑格出生于英国格洛斯特郡,父亲是一名内科医师,曾作为传教士在中国短暂工作,后因健康原因返回英国,母亲则是从事棉花加工生意的商人后代。桑格原本打算跟随父亲的步伐迈入医学界,但高中毕业进入剑桥大学学习后,转而对生物化学产生了浓厚兴趣,决定成为一名科学家。而当时的剑桥,正好拥有诸多生物化学先驱。

1944年,桑格在剑桥取得化学专业的博士学位,留校跟随正在研究胰岛素的生物化学系新任教授阿尔伯特·查尔斯·奇布诺尔开始了博士后研究,专注于为氨基酸排序的工作。胰岛素在人体的糖代谢过程中起到重要作用,如果胰岛素分泌不足,就有可能导致糖尿病。科学家开始关注胰岛素的生化性质,不仅仅因为它具有医学的应用前景,还因为它是当时仅有的几种能够被提纯的蛋白质。

在桑格涉足胰岛素研究之时,世界生物学界对于蛋白质的认知存在较大分歧,一种观点认为,蛋白质没有明确的化学组成和结构;而另一派则坚持认为蛋白质具有结构,并且可以通过化学方法测定氨基酸的排列顺序。

桑格发现了一种方法,可以截断连接氨基酸链的“桥”,这使得他可以研究单个的氨基酸片段,然后他又将这些片段重新组合成氨基酸长链,进而推导出完整的胰岛素结构。1953年,桑格成功地测序了胰岛素的氨基酸序列,推翻了原本蛋白质是无序高分子的推论,这项研究极大推进了生命科学的发展,并给桑格带来了1958年的诺贝尔化学奖。

获得1958年的诺贝尔化学奖之后,来自世界各地的访学和学术报告邀请纷至沓来,不过很快,桑格又投入了基因测序的研究之中。


蛋白质测序的困局?

如果说基因检测方面的技术进步帮助我们快速而全面地了解了人类健康相关的成千上万个基因,那么蛋白质测序就以同样的方式揭开了成千上万种蛋白质的奥秘。在癌症、阿尔茨海默症、心力衰竭和糖尿病等许多疾病中,细胞产生的蛋白质等物质可以充当类似于指纹的独特的生物标志物,更好地检测这些生物标志物能够帮助研究人员了解疾病成因,也能为患者提供更早、更准确的诊断。

蛋白质测序除了可以更好地检测疾病的生物标志物,还可能提供一种全新的方式研究癌症等问题。比如,研究人员可以逐个观察细胞,以了解肿瘤如何从一小群相同的细胞演变成一群遗传分化的、各具优劣势的细胞。这些研究将为开发治疗癌症的新方法提供思路。

虽然今天基因测序方法的增长速度很快,但蛋白质的测序方法,却在很大程度上落后了。目前的蛋白质测序方法主要分为三类:基于PCR扩增的蛋白质测序、Edman降解测序以及基于质谱的蛋白质测序。

基于PCR扩增的蛋白质测序是利用细胞中表达的DNA或者RNA进行基因测序,然后再按照氨基酸密码子表转换为蛋白质的氨基酸序列,本质上属于基因测序技术。Edman降解测序是较早发展的蛋白质测序技术,利用化学方法从蛋白质的N端将氨基酸依次降解,再使用高效液相色谱对氨基酸进行鉴定。但是这种方法只能用于鉴定蛋白质和多肽的N-末端氨基酸残基,无法对大的蛋白质进行全序列测定。此外,Edman降解法也有一定的局限,例如N末端封闭或有化学修饰的情况下将不能使用Edman降解法对蛋白质序列进行分析。目前使用最广的蛋白质测序方法是质谱法,较Edman降解法而言,其优点在于,质谱法更敏感,可以更快地裂解肽,可以识别末端封闭或修饰的蛋白质。

换言之,尽管蛋白质作为中心法则上的最后一环,科学家们可以在一定程度上通过基因序列推断对应的蛋白质序列,结合现有的Edman降解或质谱等方法获得部分肽段序列信息,就可以在一定程度上实现蛋白质测序。但是这些方法在针对蛋白质的翻译后修饰检测、蛋白质序列变化监测和低丰度蛋白质富集等方面仍然存在局限。这就要求蛋白质测序的发展方向一定是对蛋白质的从头测序,且尽量能够实现单细胞水平的蛋白质输入。


蛋白质测序路向何方?

为了改善当前蛋白质测序的局限,2018 年,德克萨斯大学奥斯汀分校的生物化学家Edward Marcotte 开发了一种称为单分子荧光测序的方法。在此过程中,用不同的荧光标记蛋白质,可以对单个样本中的数百万个蛋白分子进行测序。“我们基本上创造了一种类似 DNA 测序的技术来研究蛋白质(序列)。”

荧光测序也是最早开发的高通量单分子蛋白质测序方法之一,它将荧光肽的单分子显微镜与Pehr Edman的降解化学相结合,使许多单独的肽分子能够在测序流动池中被平行监测,因为它们的N端氨基酸以循环方式被移除。

可以说,荧光测序是自下而上的蛋白质组学方法的一个例子,利用已知的蛋白质组或基因组序列,确定单个蛋白水解肽或蛋白质片段的部分序列,然后将其与用于蛋白质鉴定的参考数据库相匹配。

人们已经证明了不需要对蛋白质上的每个氨基酸进行从头鉴定,而是鉴定几个氨基酸的序列位置就足以从参考蛋白质组中鉴定出蛋白质。在实践中,荧光测序是一种混合方法,识别标记氨基酸从头开始的序列位置,然后将这些部分序列与参考数据库进行匹配,以识别蛋白质。

除此之外,其他研究人员还在开发模拟基于纳米孔的 DNA 测序的技术,根据多肽通过微小通道时在电流中引起的变化来分析多肽。如荷兰代尔夫特理工大学的生物物理学家Cees Dekker 和他的同事使用由蛋白质制成的纳米孔,并且能够区分通过孔的多肽中的单个氨基酸;以色列理工学院生物医学工程师 Amit Meller 的团队正在研究由硅基材料制成的固态纳米孔装置,这些装置可以同时对许多单个蛋白质分子进行高通量分析。

2022年,美国Quantum-Si公司Brian D. Reed研究组还提出了一个单分子蛋白质测序的方法以及集成系统可以对蛋白质组学进行研究。其中,为了实现单分子蛋白质的测序,研究人你有们使用互补金属氧化物半导体制造技术构建了具有纳秒精度的定制时域敏感半导体芯片,包含用于单分子检测的完整集成组件,其中包括光传感器、光波导电路和用于生物分子固定化的反应室。

目前,虽然单分子蛋白质测序仍然只是概念验证,但商业化正在快速到来。2022 年,Quantum-Si 公司成为商业化首个下一代单分子蛋白测序平台的公司,它使用荧光标记的结合蛋白来识别蛋白质末端的特定氨基酸或多肽序列。该公司已宣布计划在今年推出第一代仪器。

总的来说,蛋白质测序为生物过程提供了深刻的见解。然而,想要了解细胞中蛋白质组的复杂性以及动态变化、在疾病状态下的变化,并将这种技术变成一个易获取、低造价的方法并不容易,即便如此,蛋白质测序依然非常重要性,这也是Nature会将蛋白质测序认为是2023年值得关注的7项技术之一的原因。