第七章RNA的生物合成ppt课件.ppt
第七章 RNA的生物合成,一、转录概述二、转录反应的模板三、DNA指导的RNA聚合酶四、启动子与终止子五、RNA的酶促合成六、原核生物RNA的转录后加工七、真核生物RNA的合成八、真核生物RNA的转录加工九、RNA 的生物学功能,第七章 RNA的生物合成一、转录概述(RNA生物合成概念),RNA几乎总是线性单链的,极少有环状RNA分子。但几乎每个RNA分子都有许多短的双螺旋部分,称为发夹。除了标准的GC和AU对之外,还有较弱的GU对可帮助单链RNA形成二级结构。一条正在延伸的RNA链的二级结构会影响这个RNA分子的剩下部分的合成。一个细胞中含有许多不同的RNA分子,其长度为50个核苷酸到数万个核苷酸不等。,RNA合成需要RNA聚合酶。E.coli细胞中约有RNA聚合酶分子3000个。此酶催化RNA主链中核苷酸间的3,5磷酸二酯键的形成,催化反应速度很快,在37时RNA链的延伸可达5090个核苷酸/秒。RNA的合成是以DNA为模板合成核糖核苷酸链的过程,故称为转录(transcription)。RNA的合成非常精确,转录没有校正机制(proofreading)。由于细胞RNA不能自我复制,故即使偶有差错亦不会遗传下去。,双链DNA分子中只有一条链作为RNA模板。作模板的DNA链称为反义链,不作模板的DNA链称为有义链。如果DNA的两条链均作为RNA模板,则每个基因必将产生两条互补的RNA。而遗传学证明每个基因只合成了一条RNA链。即使合成两条RNA链,其中也只有一条有功能。事实上,在活体内只存在这两条RNA链中的一条。如将双链DNA加热使之变性,再加入以此DNA为模板所合成的单链RNA,进行退火。结果除复性的DNA双螺旋外,还形成了DNA-RNA杂种分子。结果表明只有一条DNA链被转录。,用RNA聚合酶在体外对DNA双螺旋进行转录,结果取决于DNA模板受到损伤的程度。例如将T7 DNA变性,RNA聚合酶能与单链DNA结合,两条均能被转录。但如果用天然的完整双链DNA为模板,则RNA聚合酶仅能和称为启动子的顺序结合,从而只能转录在活体内被转录的那条链。RNA转录还需要两个基本结构元件启动子和终止子。DNA链上从启动子到终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。,二、转录反应的模板,转录反应不但需要DNA作为模板,而且不同的RNA聚合酶对DNA两股链以及不同的DNA段落都有一定的选择性。,对于不同的基因来说,其转录信息可以存在于两条不同的DNA链上。能够转录RNA的那条DNA链称为模板链,或负链(-链);对应的链称为编码链,即正链(+链)。,模板链(-链),编码链(+链),5,5,3,3,5,5,(一)、模板的必要性,实验证明:在RNA聚合酶参与RNA合成的系统中,若是缺少DNA模板,或者事先用脱氧核糖核酸酶(DNase)处理,破坏DNA模板,这个系统就不能合成RNA。若在这个系统中补加DNA,或者使DNase钝化,或分离除去DNase,这个系统就能恢复合成RNA的正常功能。新合成的RNA碱基顺序完全与该系统中DNA的,碱基顺序互补。新生RNA即是模板DNA的互补体。这说明,在RNA聚合酶参与的反应中,DNA不但能起动RNA的合成,而且它也能决定RNA产物的全部碱基顺序。另一方面,在DNA链上有许多可以构成回文结构的对称顺序。它是转录调控因子的识别信号。这都说明模板在转录作用中所处的重要地位。,(二)、RNA聚合酶对模板的选择,RNA聚合酶对模板的选择包含两层意思。其一是不同的RNA聚合酶转录不同的基因,合成不同的RNA。其二是RNA聚合酶对DNA的两股链有选择性。转录(transcription)的不对称性就是指转录只以双链DNA中的一条链作为模板进行转录,将遗传信息由DNA传递给RNA的现象。,(三)、模板中信息连续性,在模板中,基因信息通常是不连续的。在信息内部或者在信息之间,往往存在一些不表达的插入顺序及间隔顺序。这些插入顺序和间隔顺序一般可能与信息顺序一起转录。,初生RNA中的插入顺序或间隔顺序,有的在RNA转录后的“加工”过程中被删除;有一些间隔顺序被保留在mRNA中,作为多顺反子mRNA合成蛋白质时的“标点符号”,或在蛋白质合成中起调控作用(例如,原核生物mRNA中不同顺反子之间的间隔顺序)。,大肠杆菌的RNA聚合酶,具有很复杂的结构。其活性形式(全酶)为15S,由5种不同的多肽链构成,按分子量大小排列分别为(160000),(155000),(3200092000),(40000)和(9000)。每分子RNA聚合酶除有两个亚基外,其余亚基均只有一个,故全酶为:,三、DNA指导的RNA聚合酶,(一)、大肠杆菌RNA聚合酶的结构,2(465000)(见下表)。全酶形状为椭圆球形,可结合约60个核苷酸。,*基因图是指传统的E.coli的遗传图谱,E.coli RNA聚合酶的亚基和转录因子,亚基:识别启动子,起始转录。亚基和其他肽链的结合不很牢固,易脱离全酶。,图7-1 大肠杆菌RNA聚合酶与DNA的相互作用,核心酶:全酶脱离亚基剩下的2称为核心酶。核心酶本身就能催化核苷酸间磷酸二酯键的形成。亚基:是酶和底物结合的部位和催化位点。利福平(rifampicin)和利福霉素(rifamycin)通过结合亚基,对全酶有强烈的抑制作用,抑制RNA合成的起始,但不抑制其延长。亚基基因rpoB突变可使细菌对利福平有抗性。,链霉溶菌素(streptolydigin)能抑制RNA链的延长,rpoB突变却可使细胞对链霉溶菌素亦发生抗性。亚基:其作用是与模板DNA相结合。亚基的碱性较强,适于与模板DNA相结合。肝素是一种多价阴离子,能和亚基结合,从而抑制DNA与RNA聚合酶相结合,进一步抑制转录作用。,亚基:功能现尚未知。然而,当噬菌体T4感染E.coli时,其亚基即在精氨酸上被ADP-核糖化。这种修饰作用使该RNA聚合酶全酶对其原先识别的启动子的亲和力减弱。所以有人认为,亚基的功能可能参与全酶和启动子的牢固结合。某些噬菌体的RNA聚合酶仅由一条多肽链组成。例如噬菌体T3和T7的RNA聚合酶分子都是一条多肽链,分子量约11000,它们能很快合成RNA,其速率在37时可达约200核苷酸/秒。,噬菌体RNA聚合酶只能识别噬菌体本身所有的启动子,不能识别其他启动子。宿主细胞的RNA聚合酶却能转录细胞内的许多转录单位(1000个)中的任意一个。这些转录单位中有一些可由RNA聚合酶直接转录,不需要其他因子的帮助。但大多数转录单位仅在更多的蛋白质因子存在下才能被该RNA聚合酶所转录。,(二)、RNA聚合酶的基因,E.coli RNA聚合酶各亚基的基因(除亚基基因尚不详外)均存在于三个操纵子中,这些操纵子还含有蛋白质合成和DNA合成所需的基因。,操纵子含有DNA引物酶的基因,有两个连续的启动子,同rRNA的操纵子一样,受ppGpp分子的调控,故与生长速度有关。操纵子前面两个基因L11和L1,有时被认为组成另一个独立的操纵子,因为在L10基因之前另有一启动子。这些基因编码核糖体蛋白。操纵子中基因前面有S13、S11、S4 三个基因,后面有L17基因。,和操纵子中基因的转录量并不相等,在和操纵子的核糖体蛋白基因的后面有衰减子(attenuators),可使其后的RNA聚合酶基因的转录大为降低。因此,在每个细胞中RNA聚合酶亚基的数目(约3000个)要大大少于核糖体蛋白的分子数(约20000个),这是符合细菌需要的。,然而令人不解的是DNA引物酶基因位于基因之前,而细胞内亚基的数目反而要比引物酶分子数多60倍(3000比50)。这些操纵子内都有几个次要的启动子,说明实际的调控作用还要更为复杂得多。现在还不清楚这些操纵子是如何进行调节的。,L17,S4,S13,S11,p,操纵子,DNA引物酶,主要启动子(P):在操纵子的左侧,向右转录。次要启动子(p):包括操纵子中的PHS(热休克下才有活性的启动子),位于操纵子之内,仅启动在其右侧的基因。,RNA聚合酶的作用,识别启动子。主要依赖于亚基,亚基只参与转录的起始,并决定转录的方向。与DNA结合并使之解链,另外还具有解旋、重新使DNA螺旋化作用。催化RNA聚合反应。负责三种RNA合成。RNA聚合酶核心酶通过与不同的亚基结合,识别不同的启动子。,(三)、真核生物RNA聚合酶,细菌只有一种RNA聚合酶,它完成细胞中所有RNA的合成。真核细胞的转录机构更加复杂。真核细胞核内产生三种RNA聚合酶,位于不同的部位,且均有复杂的亚基结构。每种酶负责不同种类基因的转录。它们的一般性质见下表。,真核细胞的三种RNA聚合酶,RNA聚合酶的活性最显著。位于核仁中,负责转录rRNA基因(rDNA),细胞内的RNA绝大部分是rRNA。其活性不被-鹅膏蕈碱所抑制。RNA聚合酶位于核浆中,负责hnRNA的合成。hnRNA是mRNA的前体。其活性可被低浓度的-鹅膏蕈碱所迅速抑制。,RNA聚合酶负责合成tRNA和许多小的核内RNAs。聚合酶对-鹅膏蕈碱的反应则不尽相同:在动物细胞中聚合酶可被高浓度-鹅膏蕈碱所抑制,而在酵母和昆虫细胞中则不会被抑制。,某些常用的转录抑制剂,粗制的真核生物RNA聚合酶大而复杂,相对分子质量达500000或更多。其亚基组成亦很复杂:每个酶分子有两个大亚基,(一个约200000,另一约140000),还有10个以下的小亚基,每个相对分子质量约为10000-90000。,三种酶中也有一些共同的亚基,在复杂的真核细胞中执行不同功能的三种酶可能是由一个原始的酶进化而来。因为直到现在还不能用亚基来重建活性的酶分子。因此,还难以提出确切的证据说明这些亚基是否真正都是酶分子的固有的组成部分,也不知道哪些亚基负责催化,哪些负责调节功能。,线粒体和叶绿体中的RNA聚合酶要小得多,并且和细胞核中的酶完全不同。当然,细胞器的基因组小得很,故其聚合酶所需要转录的基因数也很少。而且转录的调控看来也要简单得多。所以这些酶类似于噬菌体RNA聚合酶。,所有三种RNA聚合酶均有其对应的启动子和终止子。以聚合酶所识别的启动子研究得最多,并发现这种启动子很奇怪不是位于转录起始点的前面,而是在转录起始点的下游。RNA聚合酶合成mRNA,它是最直接和遗传调节相关的酶。因此对聚合酶的研究是目前的热点之一。,困难之处在于:除非有一些现在还不能确定的一些蛋白质存在,完全纯化的酶似乎不能在天然启动子上工作。这些不确定的蛋白质可能包括一些起始因子(类似细菌中的因子),但是肯定还有其他几种因子。用突变分析方法证明,影响转录作用的DNA节段远比细菌启动子要长得多。在细胞内增强子对启动子的活性很重要;对增强子的研究也是目前的热点之一。,1.原核生物启动子启动子是指RNA聚合酶识别、特异结合和开始转录的一段DNA序列。RNA聚合酶起始转录需要的辅助因子(蛋白质)称为转录因子。在基因表达调控中,转录起始是关键,基因是否能表达决定于在特定的启动子起始过程。,三、启动子与终止子(一)、启动子和转录因子,只有RNA聚合酶能够特异性地与启动子相结合。亚基起识别作用,没有时,核心酶偶而亦能起始RNA的合成,但有许多起始错误,而且核心酶所合成的RNA链的起始在某个基因的两条链上是随机的。但当存在时,则起始在正确的位点上。,RNA聚合酶能否与启动子相互作用是起始转录的关键问题。不同启动子对RNA聚合酶的亲和力各不同。可能对调控转录起始的频率,即对基因表达的程度有重要作用。,为什么RNA聚合酶能够仅在启动子处结合呢?RNA聚合酶分子上可能有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构;启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。,1)启动子的共同顺序,利用“足迹法”和测序技术,对100多种启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的特征如下:-35区:T85T83G81A61C69A52(-35bp,-35序列)-10区:T89A89T50A65A65T100(-10bp,-10序列),启动子的共同顺序,大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。共同顺序是启动子的关键部位。,40 Sextama 20 Pribnow 11.lac CCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTG2.fdG2 CTTTTTGATGCAATTCGCTTTGCTTCTGACTATAATAGACAGGGTAA3.PL GGCGGTGTTGACATAAATACCACTGGCGGTGATACTGAGCACATCAG4.PR GTGCGTGTTGACTATTTTACCTCTGGCGGTGATAATGGTTGCATGTA5.tRNAlTyr CGTAACACTTTACAGCGGCGCGTCATTTGATATGATGCGCCCCGCTTT82T87G78A65C54A45T80A95T45A50A50T9817bp图7-5 几种原核启动子的结构顺序比较,启动子的共同顺序,-35序列是RNA聚合酶全酶的识别位点,对全酶有很高的亲和性。如果-35序列发生突变或缺失,将大大降低对全酶的亲和性,即降低RNA聚合酶与启动子的结合速度,但不影响转录起始位点附近DNA 双链的解开。,-10序列又称为Pribnow盒,或TATA盒,是 RNA聚合酶全酶的紧密结合位点。-10序列的突变不影响RNA聚合酶与启动子结合的速度,但会降低双链解开的速度。TATA盒决定着转录的方向。,可见,-35序列提供RNA聚合酶识别的信号,-10序列则有助于DNA局部双链的解开,两者共同决定了启动子的强度,也调控了转录的速度和RNA分子数。因此,-10和-35序列都很重要。同时有研究表明:离开共同顺序较远的启动子的活性亦较弱;破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近顺序中的碱基的改变。,在某些操纵子的启动子的上游,还存在有CAP-cAMP复合物的结合位点。CAP-cAMP复合物与启动子的结合是基因调控作用的一部分。,原核生物启动子的序列长约20200bp不等。E.coli典型的启动子结构(80bp)如下:,原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。,结合位点,TGTTGACA,TATAAT,起始位点,1018bp,58bp,-35序列,-10序列,CAP-cAMP,启动子附近的DNA顺序也能影响启动子的功能。rRNA合成的起始位点上游50到150bp之间的顺序是启动子的完全活性所必需的。如果这段DNA顺序缺失并由其他外来DNA所取代,则转录起始的频率将降低10倍。远离部位的富有AT的DNA顺序能增进转录起始的频率。,上游顺序是某些RNA聚合酶的“激活蛋白”的结合部位。也是拓扑异构酶的结合部位,这有利于转录起始的超螺旋状态的产生。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,影响到-10和-35区的DNA结构细节。,E.coli RNA聚合酶与启动子结合的过程可分为两步。酶识别启动子,并与其结合形成“关闭”复合体(即双螺旋形式)。这一步所识别的是-35序列。“关闭”复合体转变为“开放”复合体(即双螺旋解旋,两条链分开),此时酶的结合比较紧密。,2)RNA聚合酶与启动子的结合,在这个转变中,富含AT碱基对的-10区约有17bp被解旋,暴露出模板链。-10区的突变可阻碍开放复合体的形成。许多突变改变了-10序列中的碱基,但并未减低其AT对的水平,却仍然能阻碍其融化为开放复合体,可见-10区除了要易于融化之外,还必须有特异的形状,以便RNA聚合酶能够识别它。,RNA聚合酶与启动子的结合模式图,真核生物三种RNA聚合酶都有各自的启动子。目前对真核生物启动子了解较少,原因:原核生物启动子的鉴定方法不能直接运用于真核生物;没有找到高等真核生物启动子的突变体;由于转录因子多,其结合位点多,不易找到各种RNA聚合酶的结合位点;RNA聚合酶不易纯化,缺乏酶的结构和活性功能的资料,使酶与启动子的结合和检测有较大困难。,2.真核生物启动子,又称rRNA基因启动子或型启动子。不同真核生物型启动子序列有较大的差异,缺乏保守性。目前发现有两个区域是转录必需的:-40+5近启动子部分:为核心序列,其功能是决定转录起始的精确位置。这一段序列的全部或部分缺失,被同样长度的,1)RNA聚合酶启动子,寡聚核苷酸替代,在选择性位点作单个碱基突变等变化,都会消除或强烈降低 rDNA转录能力。-165-40远启动子部分:又称上游控制元件(UCE),其功能是影响转录的频率。这段序列受到缺失、置换、插入等破坏,可造成转录下降100倍。,又称蛋白质基因启动子或型启动子。该启动子有四个区域对转录起始和活性起着调控作用,是真核基因转录不可缺少的。转录起始位点:其碱基大多为A,两侧各有若干个嘧啶核苷酸(Inr序列),该序列对启动子的强度和确定起始位点方面都是必要的。,2)RNA聚合酶启动子,TATA盒:位于-25-30bp左右,是核心序列,又称Hogness box。其共有序列:T85A97T93A85(A63/T37)A83(A50/T37)基本上由AT组成,极少数启动子中有GCbp。,TATA盒的作用在于决定转录的起点,序列的改变会使转录位点偏移;缺失TATA盒,转录将在许多位点上开始。TATA盒决定转录的效率:如鸡蛋清蛋白基因启动子的TATA变为TAGA后,转录效率大大下降;兔珠蛋白中TATA盒是ATAAAA,人工突变为ATGTAA后,转录效率下降80%;,人的-珠蛋白基因的ATAAAA序列变为ATGAAA、ATACAA或 ATAGAA,-珠蛋白的产量大大降低,引起地中海贫血症。少数蛋白质基因缺乏TATA盒,如腺病毒DNA结合蛋白(27KD)基因的上游没有TATA盒。,上游调控区(UPE):真核型启动子上游具有多种调控元件:CAAT盒:转录起始位点上游70-80bp处的CAAT顺序。GC盒:位于CAAT盒邻近,共同顺序:GGGCGG。此外,在不同的启动子上还有其它类型的UPE,他们是转录调控因子结合的位点,影响着转录活化和频率。,远端调控区:在真核生物中,有些基因的启动子远上游区域(-100bp以上)可大大增强启动子的活性,这种序列称为增强子。增强子有两个特征:a.与启动子的相对位置不固定,而能有很大的变动;b.能在两个方向产生作用。一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。首先被发现的增强子是SV40增强子。,RNA聚合酶转录基因和启动子的组织形式表现出多样性。一般说,启动子均位于转录起点的上游。在由RNA聚合酶转录的5SRNA基因中,其启动子位于转录单位之中,在转录起点的下游50个碱基以后,约在+55到+80之间。故称为下游启动子或内部启动子。,3)RNA聚合酶启动子,在tRNA基因中启动子分为两段,均在基因内部。A段在+8和+30之间,B段在+51和+72之间。两段必须同时存在,否则不能起始。,(二)、终止子,1.原核生物终止子,提供转录停止信号的DNA序列称为终止子(terminator)。终止子的作用是在DNA模板的特异位点处终止RNA的合成。,原核细胞中有两类终止子:不依赖因子的终止子(简单终止子);依赖因子的终止子。,不依赖因子的终止子(简单终止子)不依赖因子的终止子有两个特征:a.DNA顺序有双重对称性(dyad),位于RNA3端之前15-20核苷酸处。双重对称的意义在于其转录本能形成发夹结构。体外实验显示,如果掺入其他碱基以阻止发夹形成时,终止即不发生。通常只要有一个核苷酸的改变破坏了规则的双螺旋的茎时,即可破坏终止子的功能。,b.DNA模板链中有一串约6个A,转录为RNA 3端的U。对终止子突变的分析亦显示DNA模板上多聚dA顺序的重要性。如将此序列中的一个碱基换掉,或除去部分序列(缺失)都可使终止子失活。,双重对称-DNA模板 5-CCCAGCCCGCCTAATGAGCGGGCTTTTTTTTGAACAAAA-3 3-GGGTCGGGCGGATTACTCGCCCGAAAAAAACTTGTTTTT-5 转录本 5-CCCAGCCCGCCUAAUGAGCGGGCUUUUUUUU-OH3(RNA),为什么这两个结构能引起终止呢?其解释是,发夹的茎的前半部过早地和RNA-DNA杂交双链中的后半部分退火,仅剩下多聚U序列和模板链杂交。因为这样一个由几个U和几个dA形成的RNA-DNA杂交双链是很不稳定的,于是新生RNA链将很快自DNA双链中被排除出来。,图7-12表示,RNA的一段短的双螺旋和富含U的序列如何导致终止作用和RNA链的释放的。(a)是延伸复合物恰好完成富含U的RNA链;(B)RNA-RNA杂交物(发夹)的形成破坏了一部分RNA-DNA杂交链,仅留下多聚U与多聚A的一段杂交链;(c)多聚U与多聚A杂交物解离,转录本即被释放。,图7-12 RNA合成时形成的发夹终止结构,依赖因子的终止子 依赖的终止子没有不依赖的终止子特有的多聚dA序列,并且也不是都能形成稳定的发夹。现在还不清楚因子的作用机制,但有几种可能性:a.因子在RNA的存在下能水解ATP,说明它能与新生RNA链结合,并可能应用ATP放出的能量将RNA链从酶和模板中释出。,b.因子可能与RNA聚合酶结合。编码因子的基因rho发生突变时产生的某些蛋白质仅能在RNA聚合酶的亚基也发生相应突变时才能有RNA合成的活性。,c.已知RNA聚合酶本身能识别DNA模板中依赖的终止顺序,而因子是在以后才发挥作用而释出RNA的。即使是在没有时,RNA聚合酶也在依赖的终止子处暂停,不过以后仍继续向前进。故有人认为,即使有一个很弱的发夹也可使RNA聚合酶停止前进。此时因子即可与之结合而将聚合酶和RNA解离下来。所以因子具有RNA-DNA解螺旋酶的活性。,2.真核生物终止子,真核生物转录的终止信号和机制了解很少,其主要原因在于大多数RNA在转录后很快进行加工,难确定原初的3-端。,五、RNA的酶促合成,1.RNA合成的起始,在E.coli中,RNA链的起始通常是在RNA聚合酶所结合的DNA区域一端解开的双链部分,离-10开始处大约12或13个碱基处。第一个核苷酸通常是pppA或pppG,较少为pppC,偶而亦可为pppU。有时转录可在好几个相邻核苷酸处起始,也就是说RNA聚合酶似乎是可屈伸的,它能覆盖和巡游解链区的一部分,设法找出一个嘌呤作为起始,而嘧啶是它的第二选择。,然而从细胞内分离出的RNA分子的5端的核苷酸却不一定是起始转录的核苷酸。因为在合成后许多RNA链还要经过内切核酸酶加工,切成较小片段,而这些片段完全可以由嘧啶起始。例如,虽然某些tRNA链的起始是U,但它们从不含有末端三磷酸基团。它们是在体内由长链RNA切割而成的。,实际上所有细胞均含有许多种核酸酶,体外合成的RNA则往往不受核酸酶的作用。,RNA链的延伸阶段开始后,因子即从核心酶-DNA-新生RNA复合体上解离下来,并可再用于和新的核心酶结合。因子被释放的原因:它已不起作用;因子如仍然存在将会造成RNA聚合酶与启动子序列结合过紧,以致不能再沿着模板移动。,2.因子的解离,所以当因子被释放后,新生链-酶复合体与DNA模板的结合很弱,并且酶亦不再要求与特异序列的DNA结合时,链的延伸才能达到最佳状态。,正在转录的RNA聚合酶没有因子,而且在正常生长条件的细胞中可能仅有半数的酶分子是有活性的,所以细胞中核心酶分子和因子的数目是不相等的。然而两者的数目不会相差过大;可能细胞内总是保持有相当数量的游离因子,以便一旦核心酶在转录终止而释放出来时能立即重建为全酶。,RNA聚合酶在延伸新生RNA链时,继续使DNA螺旋解链,以便暴露出模板链,RNA链的生长点是大约12bp长的RNA-DNA杂交区。被延伸的酶所解开的DNA链的长度约为17bp,略长于RNA-DNA杂交链,而与在启动子形成的开放复合体的解链区的长度相等。在RNA链离开模板时,此杂交区即复原,同时两条DNA链即又重复螺旋化。,3.DNA的解链和重复螺旋化,NusA蛋白质多年来被忽视。这是因为RNA聚合酶的基本活性并不需要NusA,同时NusA也不和RNA聚合酶一起被纯化。噬菌体的N基因编码的蛋白是一种调节因子,它的功能是在噬菌体生长时防止转录的终止(抗终止作用)。而NusA蛋白能和N基因编码的蛋白紧密结合,这表示NusA在RNA合成中有重要作用。,4.转录因子NusA,NusA与RNA聚合酶核心酶相结合,这类似因子,但不太紧密,故在纯化时往往因子取代了NusA。在细胞内当因子从RNA聚合酶内释出时,NusA才能与核心酶结合。然而在RNA链延伸时,NusA亦不固定地和一个RNA分子相结合,因为已发现在转录时,一个NusA分子可与好几个RNA聚合酶分子相作用。所以即使活细胞内NusA分子不多(估计每个细胞只有数百个),仍然是够用的。很可能当RNA聚合酶从DNA上释出后,因子又马上取代了NusA蛋白。,在转录过程中,NusA究竟有什么功能还不了解。遗传学实验证明它是不可缺少的蛋白质。在体外,NusA对RNA合成的速率有明显作用,对不需因子的RNA合成的终止也是必需的。可能NusA和噬菌体的N基因编码的蛋白类似,在介导某些调节因子的作用中有重要功能。,不论原核或真核生物的rRNA和tRNA都是以初级转录本形式被合成的,然后再加工成为成熟的RNA分子。然而绝大数原核生物的mRNA却不需加工,仍为初级转录本的形式。相反,真核生物从断裂基因产生的mRNA要经过复杂的加工历程,包括去除内含子的剪接反应(splicing)。RNA的加工和成熟包括三个方面:RNA的一般加工过程 RNA的剪接作用 RNA的编辑作用,六、RNA的加工和成熟,1、原核生物mRNA前体的加工,细菌中用于指导蛋白质合成的mRNA大多不需要加工,一经转录即可直接进行翻译。但也有少数多顺反子mRNA需通过核酸内切酶切成较小的单位,然后再进行翻译。例如,核糖体大亚基蛋白L10和L7L12与RNA聚合酶和亚基的基因组成,混合操纵子,它在转录出多顺反子mRNA后需通过RNase将核糖体蛋白质与聚合酶亚基的mRNA切开,然后再各自进行翻译。该加工过程的意义在于可对mRNA的翻译进行调控。核糖体蛋白质的合成必须对应于rRNA的合成水平,并且与细胞的生长速度相适应。,细胞内RNA聚合酶的合成水平则要低得多。将二者mRNA切开,有利于各自的翻译调控。类似的加工过程也可以在某些噬菌体的多顺反子mRNA中见到。例如,大肠杆菌噬菌体T7的早期基因转录出一条长的多顺反子mRNA,经RNase切割成5个单独的mRNA和一段5端前导序列。mRNA的切割对其中某些早期蛋白质的合,成是必要的。推测可能是由于较长的mRNA产生二级结构,会阻止有关编码序列的翻译。这种RNA二级结构(可能还有三级结构)与其功能的调控关系在多种情况下均可看到,并不仅限于翻译起始的调控。通过RNA链的裂解,改变了RNA的二级结构,从而影响它的功能。,真核生物mRNA前体称为hnRNA,又称类似DNA的RNA(D-RNA)。由hnRNA加工为成熟的mRNA,经历以下过程:5 端形成特殊的帽子结构,有三类:帽子0:m7 G ppp X 单细胞生物(如酵母)帽子1:m7 G ppp Xm 多细胞生物,主要形式帽子2:m7 G ppp XmpYm 占10-15%,2.真核生物mRNA的加工,帽子的功能:为核糖体识别mRNA提供信号增加mRNA的稳定性,保护5 端。由一种360KD特异性酶切除3末端一段后,经RNA末端腺甘酸转移酶催化加上polyA尾巴(约200个A)。PolyA的功能:可能在于增加mRNA的稳定性。,通过剪接除去由内含子转录的序列。链内部核苷酸甲基化。主要是m6A,可能对mRNA前体的加工起识别作用。,真核生物mRNA的转录后加工修饰,真核生物有4种rRNA,即5.8S rRNA,18S rRNA,28S rRNA和5S rRNA。前三者的基因组成一个转录元,产生45S的前体RNA。由于真核生物rRNA的加工过程比较缓慢,其中间产物可以分离出来,因此,真核生物rRNA的加工过程比较清楚。哺乳动物45S RNA的加工有几种不同方式。例如,人类45S RNA与小鼠的45S RNA加工方式就不相同,其具体方式见图7-19。,3.真核生物rRNA的加工,图7-19 哺乳动物45S rRNA前体的转录后处理,近年来发现,哺乳动物的原始转录本并不是45S,是47S。由于3端部分很快进行转录处理,5端也除掉一小部分故变为45S。关于5S rRNA,与tRNA一起由RNA聚合酶转录。5S rRNA的基因含120bp,处在另一个转录单位中,这个单位含有120bp的转录区和600bp的非转录片段(图7-20)。,图7-20 爪蟾5S rRNA的基因结构,在原核生物中,rRNA的基因与某些tRNA的基因组成混合操纵子。其余tRNA基因也成簇存在,并与编码蛋白质的基因组成操纵子。它们在形成多顺反子转录物后,经断链成为rRNA和tRNA的前体,然后进一步加工成熟。大肠杆菌共有7个rRNA的转录单位,它们分散在基因组的各处。每个转录单位由16S rRNA、23S rRNA、5SrRNA以及,4.原核生物rRNA的加工,一个或几个tRNA的基因所组成,有时在3端5S rRNA的基因之后还有1个或几个tRNA的基因。rRNA的基因原初转录物的沉降常数为30S,相对分子质量为2.1106,约含6500个核苷酸,5末端为pppA。由于在原核生物中rRNA的加工往往与转录同时进行,因此不易得到完整的前体。,从RNase缺陷型大肠杆菌中分离到30SrRNA前体(P30)。RNaes是一种负责RNA加工的核酸内切酶,它的识别部位为特定的RNA双螺旋区。16SrRNA和23S rRNA前体为P16和P23。5S rRNA前体P5是在RNaseE作用下产生的,它可识别P5两端形成的茎环结构。,P5、P16和P23两端的多余附加序列需进一步由核酸酶切除。可能rRNA前体需先经甲基化修饰,再被核酸内切酶和核酸外切酶切割(图7-13)。不同细菌rRNA前体的加工过程并不完全相同,但基本过程类似。,图7-13 大肠杆菌rRNA前体的加工ArRNA前体的加工过程;BRNase的切割位点,原核生物rRNA含有多个甲基化修饰成分,包括甲基化碱基和甲基化核糖,尤其常见的是2-甲基核糖。16S rRNA含有约10个甲基,23SrRNA约20个甲基。一般5S rRNA中无修饰成分,不进行甲基化反应。,5.tRNA的加工,原核或真核生物中tRNA基因往往成簇存在。在原核生物中,至少某些tRNA能一起形成操纵子,并由一个启动子转录成一条长的前体RNA链。例如,T4噬菌体中8个tRNA基因组成一簇。,E.coli中已找到两个tRNA基因簇,二者均除tRNA基因外尚含有其他基因。这两个基因簇均含有tRNATyr的基因,故命名:tyrU簇,包括4个tRNA基因,tRNAThr,tRNAGly,和tRNATyr;tyrT簇,则仅包含两个相同的基因,编码tRNATyr。,在每个tRNA基因簇中,唯一的启动子常位于第一个tRNA基因之前。在最后一个tRNA基因的后面还有编码蛋白质的基因。在tyrU簇中是基因tutB(编码延长因子EF-Tu的两个基因之一)。而在tyrT簇中是编码蛋白质P的基因(蛋白质P是一种类似鱼精蛋白的多肽)。,E.coli中参与tRNA加工的酶有:RNaseP:它是一种内切核酸酶,负责切割所有tRNA分子的5端。RNaseP是一种不寻常的酶。它由蛋白质和RNA二者组成,分子中RNA有375个碱基长(约130KD);而蛋白质组分要小得多,大约只有20KD。,RNaseD:它能从RNA的3端一个一个地切去碱基,以产生tRNA的真正的3端(5端由RNaseP产生)。RNase:有外切核酸酶的活性,它能够将tRNA完全分解完。以前认为它也与tRNA加工有关,但目前认为它可能仅和RNA的分解代谢有关。在细菌中有两种tRNA前体,其区别在于其3端的序列。,型分子有CCA三联体在其3端。但某些噬菌体编码的型分子则没有CCA序列。当其他碱基被一个一个从前体分子上除去后,另由称为tRNA核苷酸转移酶的将CCA加到3端上去。真核生物中可能所有的tRNA前体都属于型,在成熟时都需要通过酶的作用,在其3端加上CCA序列。,七、RNA的编辑作用 1.RNA编辑的概念,RNA编辑(RNA editing)是指修饰或轻微改变mRNA的核苷酸顺序,使它们与对应的模板DNA的顺序有所不同的过程。RNA编辑现象的发现对分子生物学的一个基本原则提出了挑战,也为基因表达的修正提供了一种机制。遗传信息是否都存在于基因序列中?指导编辑的遗传信息是什么?,1986年,荷兰R.Benne等首先报道了RNA编辑现象,他们发现在原生动物锥虫线粒体细胞色素C氧化酶的第二个亚基基因(cox)的转录产物5端附近,含有4个非基因编码的U残基,但额外编加的U序列恰好使mRNA形成完整的开放阅读框架,抑制了该基因分子内的原有编码,产生有活性的COX。,图7-24 锥虫co基因与其表达产物的序列比较*标出插入核苷酸的位置,DNA正链序列GAGAAmRNA序列GAUUGUAUA*蛋白质序列AspGyse,在细胞色素b蛋白的mRNA的5端发现含有34个非基因编码的U。其实在1984、1985有人报道3个锥虫属的cox基因表达时存在-1移码突变,但没有引起普遍重视。,1989年,Graves等在高等植物的线粒体发现RNA编辑现象。现已证明,RNA编辑广泛存在于生物界,涉及细胞质基因和核基因转录的产物。RNA编辑方式有:碱基插入、缺失和取代。,出现编辑现象较多情况:方式:碱基插入 生物:锥虫 细胞器:线粒体 RNA:mRNA,apo-B基因(载脂蛋白B基因)的组织特异性表达受到RNA编辑的调节。,2.RNA编辑现象,apo-B基因(29个外显子)肝细胞 肠上皮细胞Apo-B100蛋白(500KD)Apo-B48蛋白(240KD)mRNA第26个外显子 5CAAUAA3 5UAAUAA3 Gln2152 终止密码,Apo-B100蛋白能与低密度脂蛋白(LDL)结合,而Apo-B48蛋白则不能。两者N端相同,都能将高密度脂蛋白运至血清中。,拯救突变位点,校正基因表达,3.RNA编辑的意义,为在非编码区出现ORF(open reading frame)提供可能,在ORF中创造起始和终止密码子,RNA编辑在内含子剪接中可能起作用,在理论上否定了通用密码子的例外现象,RNA编辑功能的发现有助于对核基因调控线粒体基因表达的认识,八、RNA的生物学功能,按照传统的观点,RNA只是基因表达的中间物,RNA的主要功能是控制蛋白质的生物合成。1981年Cech T发现四膜虫rRNA前体能通过自我拼接切除内含子,表明RNA也具有催化功能,称之为核酶。随后Altman S证明,RNase P中的RNA(M1 RNA)在适当条件下(高浓度,Mg2+或存在多胺化合物)单独也具有加工tRNA5端的催化活性。他们的研究结果不仅破除了“酶一定是蛋白质”的传统观点,而且也破除了“RNA的功能只是控制蛋白质的合成”这一传统观点。因此他们于1989年共同获诺贝尔化学奖。此后RNA的重要功能不断有新的发现。从而认识到,,DNA是携带遗传信息分子,蛋白质是执行生命功能的分子,RNA则既是信息分子,又是功能分子。归纳起来,RNA的主要功能有以下几个方面:第一,RNA在遗传信息的翻译中起着决定的作用。第二,RNA具有重要的催化功能和其他持家功能。,第三,RNA转录后加工和修饰依赖于各类小RNA和其蛋白质复合物。第四,RNA对基因表达和细胞功能具有重要调节作用。第五,RNA在生物的进化中起重要作用。,