2012年,CRISPR-Cas9基因编辑技术被开发出来,该技术被称为 "分子剪刀",允许研究人员通过在任何位置切割基因组来移除、添加或修改DNA部分。CRISPR-Cas9技术已被用于研究哪些基因在不同的条件下是关键的,如罕见的疾病和癌症,并开发修复或关闭危险突变或基因的治疗方法。

基因编辑技术的创新导致了碱基编辑的发展,它们通常被称为 "分子铅笔"。它们可以替换单个DNA碱基,是CRISPR-Cas9技术的延伸。最近的基因编辑工具创建于2019年,被称为先导编辑。这些 "分子文字处理器 "可以直接在基因组上进行高精确度的搜索和替换操作。

这些技术的最终目标是纠正人类基因的有害突变。科学家们已经发现有超过16000个小的缺失变体,即从基因组中删除了少量的DNA碱基,与各种疾病有因果关系。例如,囊性纤维化,仅三个DNA碱基的缺失导致70%的病例。2022年,碱基编辑的T细胞被成功地用于治疗一个之前的化疗和骨髓移植都失败了的病人的白血病。

目前基因编辑的挑战之一是实现基因编辑的高效率和高精确度。虽然CRISPR-Cas9系统已经使高度精确地编辑基因成为可能,但它仍然不完美,可能导致意外的脱靶效应。此外,一些类型的细胞难以编辑,而且基因编辑可能与免疫反应和引入新的突变等风险有关。研究人员正在不断努力提高基因编辑工具的准确性和效率,同时最大限度地减少与使用这些工具相关的风险。

日前,桑格研究所的研究人员开发了一种新的工具,它可以预测使用先导编辑技术将基因编辑的DNA序列成功插入细胞的基因组中的可能性。这种新的基因编辑技术是CRISPR-Cas9的进步,在治疗人类的囊性纤维化和癌症等遗传疾病方面具有巨大潜力。

来自桑格研究所的科学家们创造了3604个DNA序列,长度从1到69个DNA碱基不等。这些序列在不同的DNA修复背景下利用不同的先导编辑传递系统,被添加到三个不同的人类细胞系中。一周后,作者们对细胞的基因组进行测序,以确定编辑是否成功。

第一作者Juliane Weller说。"简单地说,DNA的几种不同组合可以编码蛋白质中的同一个氨基酸。这就是为什么要基因在蛋白质水平上实现相同的结果,却会有数百种方法可以进行编辑。通过将这些潜在的基因编辑输入机器学习算法,我们已经创建了一个模型,根据它们发挥作用的可能性对其进行排名。我们希望这将消除先导编辑中涉及的许多试验和错误,并大大加快研发进展。

该团队的下一个目标是为所有已知的人类遗传疾病创建类似的模型,以了解质料编辑是否以及如何修复它们。桑格研究所的其他研究小组及其合作者将协助进行这项工作。