近日,中国科学技术大学生命科学与医学部宋晓元教授团队和美国加州大学圣地亚戈分校医学院的美国科学院院士Michael G. Rosenfeld教授在Life Medicine发表了综述文章(Review): The 3D genome and its impacts on human health and disease;该文章对染色质高级结构的研究方法尤其是基于邻位连接的3C及其衍生的Hi-C等方法进行了系统地介绍,并且总结了正常生理过程和疾病(包括癌症、先天性疾病和病毒感染)中染色质高级结构的构象变化;同时展望了三维基因组结构领域在人类健康和疾病中应用的挑战和发展方向。

真核生物的基因组经过高度的折叠和压缩后储存在微米尺度的细胞核中,染色质在折叠和压缩的过程中形成了复杂的三维(3D)结构。在细胞核内,线性基因组中相距较远的两个位点(如转录调控元件增强子和启动子)在染色质结合蛋白以及非编码RNA (ncRNA)等的协助下可以在空间位置上相互靠近从而形成染色质相互作用,并参与调控基因表达等染色质相关的生物学过程。染色质相互作用可以通过染色质构象捕获(chromosome conformation capture, 3C)技术以及基于3C发展而来的一系列相关技术进行检测和研究,其中全基因范围的染色质相互作用捕获技术Hi-C的开发和应用极大地促进了我们对正常生理和疾病过程中染色质高级结构变化以及这些变化对转录调控等影响的了解。这对于我们深入了解生理过程和疾病的发生发展具有重要的意义。

真核生物的染色质在细胞核中形成不同尺度的高级结构,从约100 Mb的染色体疆域(Territories),到1-100 Mb的A/B区室(compartments),到40 kb至3 Mb的拓扑相关结构域(TADs),再到1 kb-几个Mb的染色质环(chromatin loops,包括CTCF环和增强子-启动子环),形成高度压缩而又灵活调控的三维基因组构象,并参与调控基因表达等重要生物学功能。

研究染色质高级结构的方法根据原理主要分为三种:基于分子生物学和测序的方法、基于成像的方法和基于计算模拟的方法。文章着重介绍了分子生物学研究方法中比较常见的基于邻位连接的方法,即由3C发展到4C、5C和3D-DSL以及到Hi-C和Micro-C这一系列由点到局部再到全基因组并不断提高分辨率的染色质构象捕获技术,以及ChIA-PET、PLAC-Seq和HiChIP等可以捕捉特定蛋白质介导的全基因组相互作用,还有Trac-loop、OCEAN-C、HiCAR和NicE-C等可以捕获开放染色质区域的相互作用尤其是增强子-启动子环的技术。

基于这些技术的开发和应用,我们认识到包括有丝分裂、减数分裂、早期胚胎发育和细胞衰老等正常生理过程中染色质高级结构的动态变化,也发现在一些肿瘤和先天性疾病中以及病毒感染前后染色质构象都会发生变化。

除了将Hi-C等相关方法应用于疾病的诊治新策略之外,我们还可以再次分析现有的数据,以获得新的见解。例如,基于三维基因组技术,可以将全基因组关联研究(GWAS)筛选出的与疾病相关的单核苷酸多态性(SNPs)与基因联系起来。此外,三维基因组的结构改变可以引起基因的差异表达,对染色质结构及其动态变化的研究有助于揭示基因特异性表达调控的上游分子机制。因此,对疾病发生、发展过程中染色质结构动态变化的研究可以促进我们对疾病发生、发展机制的认识,相关的研究也可以为我们提供新的潜在的靶点并为治疗疾病提供新的思路。随着更先进、更专业的技术的开发,我们将能更广泛地开辟三维基因组结构领域并拓展其在人类健康和疾病中的应用。

基于3C及衍生技术研究正常生理及疾病过程中染色质高级结构的模型图

英文全文链接:https://doi.org/10.1093/lifemedi/lnad012

引用本文:Siqi Wang, Zhengyu Luo, Weiguang Liu, Tengfei Hu, Zhongying Zhao, Michael G Rosenfeld, Xiaoyuan Song, The 3D genome and its impacts on human health and disease, Life Medicine, 2023;, lnad012, https://doi.org/10.1093/lifemedi/lnad012