胃癌是我国最常见的肿瘤之一,发病率和死亡率均排名第三,且近年来发病率日益增加,造成的疾病负荷也越来越重[1]。因此,寻找治疗胃癌的新靶点和新方法尤为重要。

正所谓“对症下药”,在寻找胃癌治疗新靶点及新药物前,首先需要明确它的特征。20年前,人类参考基因组图谱(GRC38)发布,大幅度加深了科学家对疾病尤其是肿瘤的认识,并极大地促进了肿瘤领域研究的进步。

然而,由于样本选择不充足等原因,这个数据库无法全面反应不同种族、地区人群的基因多样性[2]。此外,这种人类参考基因组也不完整,来自大型队列研究的长片段序列与目前的人类参考基因组无法完全匹配[3]。

针对以上问题,近年来,科学家研究出一种新的检测方法-泛基因组学法,用于研究单个样本中的基因缺失[4]。泛基因组是群体中所有个体基因组的总和,其中存在两种类型的基因,一种是所有个体共享的核心基因,另一种是部分个体共享的非必须基因(也被称为基因的存在-缺失变异,PAV)[5]。针对PAV,研究人员在2019年开发出了一款名为“HUman泛基因组自动化分析工具”(HUPAN)用于构建人类泛基因组,并表征出基因组中的PAV[6]。

那HUPAN这个锋利的“矛”是否可以刺破守护胃癌基因组PAV这个“盾”,从而揭示胃癌基因组特征,为胃癌分子靶向治疗提供出一份完整的“地图”呢?

近日,上海交通大学医学院附属瑞金医院朱正纲和于颖彦,及上海交通大学陈红专和韦朝春领衔的研究团队,在《自然·通讯》上发表了一项重要研究成果。

这项研究通过HUPAN工具分析了185对中国人胃癌及正常组织的泛基因组特征,表征了胃癌基因组中的PAV景观,确定了在中国汉族人胃癌患者中高频缺失的抑癌基因[7]。总之,这项研究揭示了中国人胃癌基因组学特征,提供了重要的分子遗传学参考。

图1. 文章封面截图

研究人员通过HUPAN工具,分析了185对胃癌和正常组织的全基因组序列(WGS),构建出了包含以往的人类参考基因组(GRC38)和80.88Mbp新序列的胃癌泛基因组(GCPAN)。

这80.88Mbp新序列中包含53.78Mbp完全未对齐序列和27.10Mbp部分未对齐序列(图2),并预测出新序列上的含82个基因,与GRC38相比,有14个基因的重复序列不到50%,意味着这段新序列上可能存在至少14个新基因。

图2. 胃癌泛基因组的构建

随后,研究人员将GCPAN作为参照,进行胃癌患者的PAV图谱分析,共计发现了261个PAV。

其中,195个PAV在肿瘤组织和正常组织中都存在,而缺失变异相对特异,有36个PAV只在正常组织中缺失,30个PAV只在肿瘤组织中缺失(图3)。

图3. 胃癌泛基因组的PAV景观

为找出癌症易感基因,研究人员将这些PAV与两个其他的基因组测序数据(数据1:SGDP项目,西蒙斯基因组,263人;数据2:中国汉族基因组,90人)进行了比较,并发现GCPAN与中国汉族基因组的PAV景观无显著差别,但有78个PAV的缺失频率与SGDP显著不同。

对缺失频率具体分析后,研究人员发现4个PAV(GSTM1、UGT2B17、ACOT1和SIGLEC14)在胃癌中高度缺失,其中,UGT2B17在亚洲胃癌患者中高频缺失,GSTM1和SIGLEC14在东亚胃癌患者中高频缺失,而ACOT1在中国汉族人群胃癌患者中的缺失频率较高(图4)。

图4. 在不同地区患者中高频缺失的PAV

研究人员用HUPAN这把锋利的“矛”打开了围绕在胃癌PAV面前的“盾”,并发现至少有14个新基因。

本着“一网打尽”的原则,研究人员对这14个新基因是否为PAV进行了分析,并发现这14个新基因中,有9个属于PAV(图5),并且在肿瘤组织和正常组织中都存在。

随后,研究人员对这9个PAV进行了染色体位点鉴定,并在这9个PAV中发现一个可鉴定出染色体位点的新基因-GC0643(图5)。

图5. 新PAV的鉴定

随后,研究人员对新基因GC0643进行了“摸底排查”,分析了GC0643染色体位点上的结构变异,匹配了GC0643编码蛋白的序列。

为了明确GC0643在胃癌中的作用,研究人员分析了65例胃癌RNA-Seq数据(GC0643缺失组 vs GC0643表达组,18 vs 47),发现GC0643缺失会引起与胃消化功能、上皮分化、抗肿瘤活性、化学代谢及先天免疫防御等15个途径有关的138个基因显著下调。

此外,研究人员对GC0643的肿瘤生物学功能进行了进一步研究。他们使用亚洲胃癌患者细胞系HGC-27过表达GC0643,发现GC0643表现出抑癌基因的特性:过表达GC0643抑制了胃癌细胞的增殖、克隆形成能力,并促进了胃癌细胞凋亡,诱导了G2/M期阻滞,抑制了肿瘤迁徙能力。

而随后的GC0643多重基因编辑实验更是证明了这个观点,过表达GC0643显著抑制了肿瘤细胞的侵袭能力,但在此基础上敲减GC0643后这种抑制效果就会消失(图7)。因此,这个新基因GC0643也被鉴定为胃癌的抑癌基因,收录于NCBI数据库(https://www.ncbi.nlm.nih.gov/nuccore/MW194843.1)。

总之,这项研究利用新兴的技术方法构建了中国胃癌患者泛基因组图谱,并通过HUPAN工具揭示了胃癌中非必须基因(PAV)景观,识别出汉族胃癌患者中高频缺失的基因ACOT1,同时鉴定出一种新的中国人胃癌的抑癌基因GC0643,为中国人胃癌分子遗传信息提供了重要补充。


参考文献

[1] Xia C, Dong X, Li H, et al. Cancer statistics in China and United States, 2022: profiles, trends, and determinants. Chin Med J (Engl). 2022 Feb 9;135(5):584-590. doi: 10.1097/CM9.0000000000002108.

[2] Rood JE, Regev A. The legacy of the Human Genome Project. Science. 2021 Sep 24;373(6562):1442-1443. doi: 10.1126/science.abl5403.

[3] Yang X, Lee WP, Ye K, et al. One reference genome is not enough. Genome Biol. 2019 May 24;20(1):104. doi: 10.1186/s13059-019-1717-0.

[4] Tettelin H, Masignani V, Cieslewicz MJ, et al. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial "pan-genome". Proc Natl Acad Sci U S A. 2005 Sep 27;102(39):13950-5. doi: 10.1073/pnas.0506758102.

[5] Yu Y, Wei C. A powerful HUPAN on a pan-genome study: significance and perspectives. Cancer Biol Med. 2020 Feb 15;17(1):1-5. doi: 10.20892/j.issn.2095-3941.2019.0317.

[6] Duan Z, Qiao Y, Lu J, et al. HUPAN: a pan-genome analysis pipeline for human genomes. Genome Biol. 2019 Jul 31;20(1):149. doi: 10.1186/s13059-019-1751-y.

[7] Yu Y, Zhang Z, Dong X, et al. Pangenomic analysis of Chinese gastric cancer. Nat Commun. 2022 Sep 15;13(1):5412. doi: 10.1038/s41467-022-33073-7.