在垃圾基因中寻宝，人类还有大量基因等待挖掘

编辑:中国基因网发布于:基因资讯2023-01-275362

人类还有大量的基因没有被发现，尤其是在一些非功能基因区（过去称为垃圾基因），有大量的基因等待人类去发掘。（人民视觉/图）

自从人类基因组计划完成以来，对人体自身的功能基因的数量一直有一个估值区间，即2万-2.5万个。尽管如此，人类还有大量的基因没有被发现，尤其是在一些非功能基因区（过去称为垃圾基因），有大量的基因等待人类去发掘。

希腊瓦里生物医学科学研究中心和爱尔兰都柏林大学的研究人员在2022年12月20日出版的《细胞报告》杂志上发表论文指出，他们发现了155个来自独特DNA区域的基因。新基因可从基因组中已经存在的复制事件中产生，然而，此次发现的这些新基因是从零开始的。

微基因

人类的基因富矿有两类，一种是原本存在于基因组中但以前没有发现的，一种是从零开始的，也就是新演化出的基因。前者证明，人类的基因非常丰饶，后者证明人类还在演化。

新发现的这155个基因都是微基因，是从人类DNA的微小片段自发产生的。这些微基因可以编码产生微蛋白（微肽），从而参与生命过程、生理功能和疾病产生等。

生物学有一个中心法则，遗传信息一般由脱氧核糖核酸（DNA）转录到核糖核酸（RNA），再翻译产生蛋白质。人类基因组计划表明，人类基因组3/4的基因能够被转录,但只有约1.5%的基因具有编码蛋白的能力，也就是约2万个功能基因。

但是，根据“如无必要，勿增实体”的原则，人类基因组中大量的非蛋白编码基因也应当包含着大量的遗传信息，否则它们就没有存在的必要。随着研究的深入，人类基因组中的大量非编码基因的奥秘正在揭开。

可以编码蛋白的基因位于人类基因组中的开放阅读框(ORF)，指的是起始密码子与终止密码子间的潜在翻译序列，可翻译的ORF通常是指mRNA上的编码序列(CDS)，这些序列翻译产生具有生物学功能的蛋白质。

ORF编码蛋白质的可能性随着其长度的增加而增加,发现和查找功能基因大多以300个密码子或100个氨基酸为阈值。但是，人类基因组中还存在大量的小开放阅读框序列(sORF)，它们在序列长度上明显与ORF有区别。sORF的大小可以从最低2个密码子到100个密码子，也即微基因。过去认为，sORF的基因极小而不具有编码功能。因为大部分基因处于非蛋白质编码区域，这部分基因转录产生大量的非编码RNA（ncRNA）

但是，大量研究发现，真核细胞基因组中存在数百万个sORF序列，有些sORF序列可以定位到转录本，这部分sORF具有编码并翻译产生蛋白的能力，这些微小蛋白也被称为微肽，是长度小于100个氨基酸的蛋白质。

更多的研究证明，非编码RNA分子序列上含有小开放阅读框序列(sORF)可编码小于100个氨基酸的微小蛋白（微肽），而且这些微肽可通过与其他蛋白相互作用而发挥其生理或病理的作用，包括钙离子稳态、代谢、成肌细胞融合、肌肉发育、胚胎发育、物质降解、癌症等。

新基因与人类演化

希腊和爱尔兰研究人员此次发现的155个独特基因就是从小开放阅读框序列中发现的微基因，它们可以编码产生一些有特别功能的蛋白质。这是在创建一个将人类与其他脊椎动物物种进行比较的祖先树后发现的。

这些新基因中的一些可追溯到哺乳动物的远古起源，其中一些微基因被预测与人类特有的疾病有关。在这155个新基因中，有44个与细胞培养物的生长缺陷有关，证明这些基因在维持健康的生命系统中的重要性。另外有3个基因与3种疾病相关，肌肉营养不良、视网膜色素变性和阿拉善综合征。

另外，在小开放阅读框序列也发现了人类单独的新基因，例如与心脏有关的基因。研究人员发现了一种增强子RNA（lncRNA）基因，在小鼠、狗、大鼠或鸡的任何组织中均未检测到直系同源转录。

该基因与心脏组织密切相关，相关性最强的靶器官是室腔，其次是心脏瓣膜、心房、黑色素细胞、房室瓣和色素细胞。在黑猩猩中，只发现心脏组织中该基因的转录位点具有活性，但在任何其他组织中都没有。在有数据可查的大猩猩、猩猩或猕猴中都没有发现该基因的心脏表达。表明该基因为人类独有，是在人的演化从头出现的，表明人还在继续演化。

另外，即便是在开放阅读框(ORF)内，也发现了一些以前从未发现的功能基因。德国莱比锡大学医学院的一个研究小组发现一种基因与儿童严重肥胖有关的新机制。这种基因重组导致了一种与饥饿控制有关的基因的异常表达，而大多数常规的肥胖基因检测都无法检测到这种基因。

在研究一名严重肥胖女孩的组织样本时，研究人员发现，一种特定的基因，即agouti信号蛋白(ASIP)基因在正常情况下不存在的细胞(如脂肪细胞、白细胞和神经元细胞)中大量产生。之后，莱比锡研究团队还在另外4名具有相同基因突变的患者中发现了这种基因。在这些患者中，这种单个基因的缺陷可能是他们肥胖的重要原因。受影响的儿童通常在儿童早期就会有持续的饥饿感，并暴饮暴食。

这个基因的发现让研究人员认定，单基因也可能导致肥胖，而过去认为，肥胖是多种因素共同作用的结果。