每个人都携带基因的两个副本,每个基因副本(等位基因)分别来自父母双方。如果两个等位基因完全相同,那么个体就是该等位基因的纯合子,如果不同则为杂合子。以往的遗传学理论认为,当基因表达时,两个等位基因被平等转录是常见现象,相比之下,等位基因不平等转录较为罕见。但现在,这一观点受到了挑战,一些科学家们发现等位基因的不平等转录发生在多达10%的基因中。

▲等位基因图示(图片来源:美国国家人类基因组研究院官网)

近日发表在Cell Reports上的一项研究发现,细胞也会“偏心”——只优先表达其中一个等位基因,而非平均表达,这种基因转录模式被称作“随机等位基因表达(RAE)”,RAE可能与多种疾病的发生及进展相关。这项研究由犹他大学(University of Utah)人类遗传学系的神经生物学家Christopher Gregg博士团队完成。

研究人员利用一种数学分析模型,基于大量的RNA测序数据来揭示等位基因的表达模式。他们发现,一些基因的两个等位基因在整个组织中都同等活跃,但对于另外一些基因来说(约3000个),细胞会“偏爱”其中的一个等位基因,基因转录呈现出前文提到的RAE模式。作者认为,这些基因更有可能发生有害的突变,因此可以作为预测或诊断疾病的生物标志物。

这项研究发表后引发了热议。加拿大麦吉尔大学(McGill University)的生物学家Brian Chen博士认为这项研究“非常有趣,这种研究方法真的很巧妙。”在受到学术界赞誉的同时,这些发现也引发了广泛的讨论,主要集中在RAE现象是否具有普遍性,及其背后的机制不明。


基因表达的偏向性有多普遍?

不均衡的等位基因表达是一种已知、且相对罕见的遗传现象。然而,也有一些比较常见的例外情况,例如拥有两条X染色体的细胞在发育过程中使其中一条染色体失活,以控制X连锁基因的表达水平,这些基因在双倍表达水平下可能是有害的。科学家们已经发现了随机单等位基因表达的实例——即细胞只表达一个等位基因而抑制另一个等位基因的表达,但学术界对这种现象的普遍性意见不一。一些研究表明这种现象发生在多达10%的基因中,而另外一些学者不以为然,他们的实验结果给出了不一样的答案——不平衡的基因表达可能仅仅发生在不到1%的基因中。

Christopher Gregg博士怀疑,不均衡的等位基因活动恐怕比文献中提到的更为普遍。他的团队之前在小鼠的大脑和培养的细胞中发现了广泛的等位基因不平衡的证据。“有一些基因的两个等位基因是互相配合的,但在一些基因中两个等位基因是完全脱钩的。”Gregg博士解释道。

为了将这些发现扩展到人体组织,Gregg博士的研究团队分析了来自基因型-组织表达(GTEx)联盟的大量RNAseq数据集,其中包括来自832名人类捐赠者的54个组织中15000多个基因的序列。从这个数据集中,研究人员计算了每个等位基因在各组织中的丰度。

随后,他们比较了每个个体内不同组织中各个等位基因的相对表达水平,理论上讲,如果两个等位基因以双等位基因的方式表达,其整体的等位基因表达比率应该符合二项分布,而随机表达的等位基因则不符合。作为对照,他们测试了该方法是否能区分X-连锁基因和常染色体基因,该模型将X-连锁基因标记为RAE,确证了这种分析模型辨别等位基因偏向性表达的能力。

该分析共筛选出了2762个符合RAE模式的非X-连锁基因,约占所有已知人类基因的10%。


RAE基因的功能特征

通过gene ontology(GO)分析——即注释与一组基因相关的分子靶点和生物过程,研究人员发现,RAE基因比双拷贝基因更可能参与免疫适应性和细胞可塑性过程。另一方面,双拷贝基因在进化上更为保守,更有可能与细胞生存相关,这意味着它们不太可能容忍突变,故而不适于涉及与适应性进化相关的生理过程。研究人员还发现,双拷贝基因往往位于中心粒附近,表明它们不太可能发生重组,而RAE基因更有可能聚集在端粒的尖端附近。

GO分析还显示,RAE基因与疾病有关,它们优先富集在与年龄相关的疾病(如心血管疾病、癌症和心脏病)的基因周围。研究人员表示,了解一个等位基因所处的位置以及为什么它比对应的等位基因表达水平更高,据此可以衍生出更准确的健康风险评估甚至是疾病诊断。

不仅如此,这些结果也对生物个体的所有细胞遵循同一套基因蓝图来工作的观点提出了挑战。“如果是这样,一些细胞表达一种等位基因,其他细胞却表达另一种等位基因,那么它们实际上拥有不同的基因型。这着实令人震惊。”Gregg博士说道。

对于这些发现,Brian Chen博士评论说,他认为一些基因比其他基因受到更严格的调控背后一定是有道理的,像这样的研究可能有助于科学家缩小潜在的候选致病基因名单,这些基因可能成为未来研究的目标。其他一些学者也认为这项研究具有转化的潜力。


围绕着RAE的谜团仍有待探索

然而,并不是每个人都对这一研究信服,比如瑞典卡罗林斯卡研究所的遗传学家Rickard Sandberg教授便对这项研究的发现提出了不同的见解。他指出,到目前为止,该研究所描述的RAE模式背后还没有发现任何机制基础。“这不是建立在成熟的概念上,如基因组印记、X染色体失活、等位基因不平衡性表达或随机单等位基因表达,”因此,这些发现背后的意义目前尚不十分清楚。此外,在他看来,作者在论文中使用的数学模型是否合适也有待商榷,他推测这一模型可能会发现不相关的基因表达现象,而这些现象可以用细胞间的变异来解释,如细胞特异性的可变剪接。他认为其他研究手段,如单细胞RNAseq,可以给研究人员提供更多信息,从而帮助研究人员辨别各种现象。

对于这些质疑,Gregg博士承认,随机等位基因表达背后的机制目前仍是未知,但他坚持认为团队所采用的方法是正确的。在他看来,单细胞方法的确很有用,但对整个身体的组织分析“用处有限”,而且可能产生“技术上的噪声数据”。他补充解释说,因为RAE基因对突变的容忍度更高,并与疾病有关,研究团队的工作揭示了RAE和驱动人类个体差异的因素之间“重要的新联系”,这也是未来研究的目标。

此外,Gregg博士提出,RAE现象的背后可能有多种机制在起作用,比如转录干扰——具有重叠序列的相邻基因不能同时活跃另一种可能性是增强子干扰,即两个基因竞争使用同一个增强子。但这些目前仅仅只是猜测,正如Gregg博士所说:“事实是,我们不知道RAE的原因,很可能不会有一个答案来解释所有的问题。”

除了找出RAE的机制之外,Gregg博士希望继续研究人体组织中的这种现象及其与癌症等疾病的联系。他推测RAE很可能是一个生物标志物,用于衡量肿瘤的危险程度,或者随着我们年龄的增长,身体复制DNA的能力如何变化。


参考资料:

[1] Kravitz, Stephanie N et al. “Random allelic expression in the adult human body.” Cell reports vol. 42,1 (2023): 111945. doi:10.1016/j.celrep.2022.111945

[2] Unbalanced Allele Expression Associated with Mutation, Disease,Retrieved Feb. 9th, 2023 from https://www.the-scientist.com/news-opinion/unbalanced-allele-expression-associated-with-mutation-disease-70933