每个人都知道 "基因组 "和 "DNA "这两个词,而且在日常谈话中也经常提到。 然而,即使我们模糊地理解它们是生命的信息或蓝图,也很难理解它们以何种具体形式出现在我们身体的结构中。

在这篇文章中,分子生物学家中井健太解释了这种信息和蓝图是如何传递的。

*本文基于《基因组学新教科书--从DNA探索的最新生命科学介绍》一书的部分改编版本。


基因组"、"基因"、"DNA"--它们是什么意思?

众所周知,我们的身体最初是由一个受精卵形成的。 受精卵持有成熟个体的所有细胞信息,每次细胞分裂时都会复制这些信息,因此基本上每个体细胞(在细胞核内)都有与最初受精卵相同的信息。

此外,这些信息不是简单地拥有单独分化的细胞的信息,而是以指令(程序)的形式保存,供处于未分化状态的细胞进行分裂和构建身体,如果能够成功激活,就可以从任何细胞中再生出复杂的多细胞个体。 这些信息被称为基因组信息或简称为基因组。

换句话说,基因组被定义为一个生物体所拥有的所有遗传信息的集合,这些信息使其成为它的一部分(尽管这很难准确定义)。 这是我第一次使用遗传信息这个术语,但实质上它是指每次细胞分裂或通过繁殖从父母那里传递给孩子的信息。

因此,基因组在某种意义上是一个抽象的概念,但信息的单位是基因,其物质是(核)DNA,一种大分子物质,如下所述。


含义不断变化的 "基因 "一词

事实上,基因(英文为gene)一词的含义在历史上发生了很大变化,而且今天仍被用于许多不同的场合,以至于几乎不可能给出一个简明而准确的定义。

基因最初被认为是存在的,可以说是假设性的,甚至在DNA和其他实体被理解之前。 也就是说,它们是由孟德尔在19世纪60年代首次提出的,用来解释各种特性(性状)的遗传规律,如豌豆种子的形状(孟德尔没有使用基因这个词,但提出了一个等同的概念)。

随后,利用果蝇和其他物种的遗传学在20世纪初左右蓬勃发展,而孟德尔的工作成果却不为人所知。 人们知道,作为虚拟实体的基因被安排在染色体上,并产生了染色体图,其中许多基因被安排在一个维度上。

Beadle和Tatum还通过研究与红面包霉菌生长所需营养物质有关的突变的遗传行为,提出了 "一个基因,一种酶 "的理论(约1945年)。

酶是催化生物体内化学反应的分子,通常由蛋白质组成。 换句话说,"一个基因-一个酶理论 "断言,每个基因对应着不同的酶功能。

在前面的孟德尔例子中,如果相应的基因与某种色素合成酶蛋白的细胞内产生有关,例如,黄色豌豆的特性就可以得到成功解释。


分子遗传学的诞生

另一方面,基因和DNA之间的关系在20世纪40年代首次被揭示,正如艾弗里(也拼写为Avery)的转化实验一样。 换句话说,当一个没有某种性状(在这种情况下,外表面结构)的细菌被引入从另一个具有该性状的细菌中提取的DNA时,它就会被新赋予该性状。

然而,这项研究的意义直到后来才被广泛理解,大约在20世纪50年代发现DNA的双螺旋结构的时候。 从这时起,遗传学、性状遗传方式的研究和作为实体的DNA知识被结合起来,所谓的分子遗传学,利用大肠杆菌和感染它的病毒(噬菌体),开始积极研究。


DNA中的 "基因 "存在于何处?

因此,基因最初是染色体上的一个位置(基因座,英文为locus),对应于生物体表现出的性状,但实际上它不是DNA上的一个点,而是一个局部区域,上面写的信息用来表示某些性状。

正如一基因一酶理论所言,特定的蛋白质是根据这一区域的信息产生的,而这些蛋白质的功能使人们可以从外部观察到这一性状(事实上,基因所执行的功能比仅仅是酶的反应更为多样,所以称之为一基因一蛋白理论更为准确)。 (事实上,称其为一基因一蛋白理论更为准确,因为基因所执行的功能是多种多样的,并不限于酶的反应)。

更确切地说,DNA的部分信息首先被复制到RNA中,这是一种与DNA相似的物质,然后被用来合成蛋白质。

一个典型的基因是一种蛋白质的蓝图。 因此,我们很容易认为,写有蓝图的DNA上的起点到终点对应的是一个基因。 另外,当蛋白质由DNA信息合成时,它首先被复制到RNA中,所以复制的区域可以被视为一个基因。

然而,由于RNA的复制起点和终点位置有时存在较大的波动,这种想法很难用于严格的定义。 尽管如此,为了方便起见,公众通常认为基因大致是指被复制成RNA的DNA区域。

然而,遗传信息不仅是关于由RNA合成什么蛋白质的信息。

遗传信息不仅告诉人们一个蛋白质的结构

事实上,在遗传信息中,不仅关于 "合成什么 "蛋白质的结构信息,而且关于 "在什么情况下 "合成蛋白质的调节信息也很重要。

这样的信息往往写在离写有蛋白质结构信息的区域很远的地方,甚至常常不清楚这样的信息究竟写在哪里。

因此,这类区域(调节区)通常应被视为基因的一部分,但它们通常不包括在基因组数据库中被描述为基因的区域中。


RNA和DNA之间的区别

让我们先简单介绍一下RNA,它是核糖核酸的缩写,是DNA的聚合亲属(如上所述,DNA代表脱氧核糖核酸;DNA和RNA统称为核酸)。

在化学上,RNA与DNA的不同之处在于,在RNA中,连接在核苷酸中糖(核糖)2'位置的碳上的氢被一个羟基(-OH)所取代(相反,RNA中核糖中的氧被去除(意味着'脱氧'),形成DNA。

因此,准确地说,DNA的结构单位是脱氧核苷酸,RNA的单位是(核糖)核苷酸。 还应注意的是,尽管生物体内使用的四种碱基与DNA中的相同,但由于结构上的要求,用尿嘧啶(U)代替了胸腺嘧啶(T)。

与DNA不同,RNA的化学性质相对不稳定,容易在羟基处被水解。 长的RNA可能暂时与对方形成互补的双链结构,但绝不会以稳定的方式形成(某些病毒有双链RNA基因组,但它们被分割成短的片段)。

顺便说一下,据说RNA采取的双螺旋结构更接近A型结构,比B型结构更短、更紧凑、碱基对倾斜,而不是DNA的标准B型结构。 因此,RNA不适合像DNA那样在细胞核中稳定保留遗传信息。


如何 "阅读 "DNA序列。

遗传信息从DNA到蛋白质的单向传输,通常是通过RNA,被称为 "中心教条"。 基本原理是由克里克在1957年提出的:从DNA到RNA到蛋白质的信息流是分子生物学的基础,虽然有例外,但基本上适用于地球上所有的生物体。

A、T、G和C四个碱基类型有不同的构象。 它们位于双螺旋内部,这似乎有点难以区分,但一些碱基对暴露在双螺旋的凹槽中。 在体内识别它们的主要角色是蛋白质。

蛋白质有一个特定的形状(三维结构),简单地说,特定的碱基序列就像一个钥匙孔,而与之完全吻合的蛋白质结构就像一把钥匙。 对于对应于各种关键孔的序列,有关键的DNA结合蛋白可以识别每一种。

特别是,参与转录调控的DNA蛋白被称为转录因子,应该记住,它们的三维结构足够精确,可以作为钥匙使用。


RNA的各种 "例外情况

当我们讨论RNA的结构时,我们提到RNA不适合像DNA那样将遗传信息稳定地保留在细胞核中。 相反,它的不稳定性使它能够像蛋白质一样催化化学反应。 具有这种酶活性的RNA被称为核糖核酸。

RNA世界假说提出,最早的生命现象(信息的维护和基于这种信息的化学反应),估计有40亿年左右的历史,可能完全由RNA分子完成。 RNA世界假说认为,在最早的时期,RNA分子可能是所有生命现象的原因。

无论这一假设是否属实,最近人们已经知道,RNA在我们的细胞中发挥着广泛的作用。

从RNA到蛋白质通过RNA的单向传输 "这一中心教条的基础是由克里克在1957年提出的,他当时给它起了一个如此夸张的名字,以强调如果由于某种原因,蛋白质(性状)层面的信息发生了变化,这种变化不会传回原始核酸。 这显然是为了强调这样一个事实:即使蛋白质(性状)层面的信息由于某种原因发生了变化,这种变化也不会传递到原来的核酸。

从某种意义上说,这是对拉马克进化论观点的否定,即个体在生活中获得的性状(后天性状)由其后代继承。

然而,后来人们发现了中心教条的各种例外情况,至少是DNA→RNA→蛋白质这样的模式化情况。 最重要的一次是发现了逆转录酶,它从RNA信息中合成DNA。

此外,虽然有些例外,但最近人们知道,所谓的后天性状也可以通过表观遗传学的现象进行遗传。

这些可能表明,生命科学中的每一个概念都可能有例外,任何事情都不应该被视为教条主义或原教旨主义。

我想更详细地研究RNA的各种可能性,但在这之前,我想看看容纳这些遗传信息的 "小房间",即 "细胞"。 通过了解RNA在今天的克隆和多能细胞研究中的意义,我们将能够更深入地理解它。