功能基因组学面临的核心挑战之一是精确高效地调控成千上万个基因的表达。CRISPR表观遗传修饰系统使得高通量定向操控基因表达成为可能。这些技术利用失活的Cas9蛋白 (dCas9)作为特异性序列的DNA结合部分,与转录激活域 (VPR、VP64 或SAM),抑制 (KRAB) 域或染色质修饰蛋白 (p300、LSD1和EZH) 融合在一起,以实现激活或抑制给定基因功能。虽然这些技术在基因调控领域得到广泛应用,但我们至今为止仍然难以预测CRISPR介导的激活和抑制在特定基因组位点的效率。

近日,来自剑桥桑格研究院吴倩鑫,Andrew Bassett团队在Molecular Cell上发表了题为Massively parallel characterization of CRISPR activator efficacy in human induced pluripotent stem cells and neurons的文章。他们将一个小型的条形码报告基因随机插入到人诱导多能干细胞(iPSC)株系的数千个位点上,并随后利用转录因子将iPSC分化为神经细胞,以评估基因组环境以及基因的基础表达对CRISPRa影响效力。报告基因的使用使得所有位点的CRISPRa测试可以使用相同的guide RNA(sgRNA),从而将任何sgRNA特异性效应与染色质环境的影响分离开来。

作者首先利用不同染色质修饰的组合(H3K4me3, H3K4me1, H3K36me3, H3K27ac,H3K9me3,H3K27me3)使用ChromHMM模型划分出更精细的十种染色质状态。其中包括六种活性状态,三种抑制状态和一个缺乏任何染色质修饰的静止状态。在增强子中或靠近活性转录起始位点的活性区域中落地的报告基因,其表达比整合到受抑制域中的基因要高得多。这表明报告基因对染色质环境具有很强的效应,亦证明了利用小型的条形码报告基因来测试染色质环境对CRISPRa影响的可行性。

随后作者向小型的条形码报告基因定向提供CRISPRa (dCas9_VPR)并发现基础表达水平是CRISPRa效力的决定因素。基础表达水平较低的报告基因整合物通常比具有高基础表达的报告基因整合物更强烈地激活,后者无法被dCas9-VPR过度激活。但基因的基础表达程度无法解释所有的CRISPRa激活结果,通过分析chromHMM状态,作者发现,在iPSC和iNeuron阶段,染色质状态亦可调控CRISPRa激活结果。在双价染色质(bivalent chromatin)状态引入dCas9_VPR可高度激活基因表达而在高度抑制的H3K9me3(ZNF gene and repeats)状态则很难利用CRISPRa进行基因激活。

最后为了验证针对条形码报告基因得到对结论,作者利用以单细胞转录组学对96个内源基因以及10种不同的染色质状态进行了靶向激活。与条形码报告基因结果相似,双价染色质可以实现高水平的激活,而ZNF被抑制的基因只能被轻微或不能被激活。与过去的报道不同,利用单细胞测序,作者发现CRISPRa可以实现强烈的基因激活水平,相应的表达水平相当于所有表达的内源性基因中排名前25%的水平,且在大部分的情况中CRISPRa引起了显著的基因表达升高以及转录组谱图显著改变。

这项工作提供了首次阐述了预测CRISPRa效应的规则,并证明了利用CRISPRa在驱动干细胞分化方面的可行性。

原文链接:

https://doi.org/10.1016/j.molcel.2023.02.011