真核生物基因表达的调控.ppt
真核基因表达的调控,1 DNA水平的调控2 染色质水平上的基因活化调节3 转录水平的调控4 转录后水平的调控5 翻译水平调控6 翻译后水平调控7 原核与真核基因表达调控差异,内容介绍,一、真核基因组结构特点,真核基因组结构庞大 3109bp、染色质、核膜单顺反子基因不连续性 断裂基因(interrupted gene)、内含子(intron)、外显子(exon)非编码区较多 多于编码序列(9:1)含有大量重复序列,真核生物的基因组,基因组很小,大多只有一条染色体 结构简炼 存在转录单元多顺反子,原核生物基因组结构特点,有重叠基因,二、真核细胞与原核细胞在基因转录、翻译及DNA的空间结构方面存在以下几个方面的差异,试说明真核细胞与原核细胞在基因转录,翻译及DNA的空间结构方面存在的主要差异,表现在哪些方面?武汉大学2003年分子生物学硕士入学试题,在真核细胞中,一条成熟的mRNA链只能翻译出一条多肽链,很少存在原核生物中常见的多基因操纵子形式。,真核细胞DNA与组蛋白和大量非组蛋白相结合,只有一小部分DNA是裸露的。,高等真核细胞DNA中很大部分是不转录的,大部分真核细胞的基因中间还存在不被翻译的内含子。,真核生物能够有序地根据生长发育阶段的需要进行DNA片段重排,还能在需要时增加细胞内某些基因的拷贝数。,在真核生物中,基因转录的调节区相对较大,它们可能远离启动子达几百个甚至上千个碱基对,这些调节区一般通过改变整个所控制基因5上游区DNA构型来影响它与RNA聚合酶的结合能力。在原核生物中,转录的调节区都很小,大都位于启动子上游不远处,调控蛋白结合到调节位点上可直接促进或抑制RNA聚合酶与它的结合。,真核生物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质,原核生物中不存在这样严格的空间间隔。,许多真核生物的基因只有经过复杂的成熟和剪接过程,才能顺利地翻译成蛋白质。,三、基本概念,(一)基因家族(gene family),真核生物的基因组中有很多来源相同、结构相似、功能相关的基因,将这些基因称为基因家族。,同一家族中的成员有时紧密地排列在一起,成为一个基因簇(gene cluster)。,如:编码组蛋白、免疫球蛋白和血红蛋白的基因都属于基因家族,1、简单多基因家族简单多基因家族中的基因一般以串联方式前后相连。,The eukaryotic ribosomal DNA repeating unit,2、复杂多基因家族,复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。现已发现存在不同形式的复杂多基因家族。,Organization of histone genes in the animal genome,(二)断裂基因,基因的编码序列在DNA分子上是不连续的,为非编码序列所隔开,其中编码的序列称为外显子,非编码序列称内含子。,外显子(Exon):真核细胞基因DNA中的编码序 列,这些序列被转录成RNA并进而翻译为蛋白质。内含子(Intron):真核细胞基因DNA中的间插序列,这些序列被转录成RNA,但随即被剪除而不翻译。,1、外显子与内含子的连接区,指外显子和内含子的交界或称边界序列,它有两个重要特征:内含子的两端序列之间没有广泛的同源性连接区序列很短,高度保守,是RNA剪接的信号序列 5GTAG 3,2、外显子与内含子的可变调控,组成型剪接:一个基因的转录产物通过剪接只能产生一种成熟的mRNA。选择性剪接:同一基因的转录产物由于不同的剪接方式形成不同mRNA。,(三)假基因,是基因组中因突变而失活的基因,无蛋白质产物。一般是启动子出现问题。,根据其性质可分为两大类:,一是瞬时调控或称为可逆性调控,它相当于原核细胞对环境条件变化所做出的反应。瞬时调控包括某种底物或激素水平升降时,及细胞周期不同阶段中酶活性和浓度的调节。,二是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。,根据基因调控在同一事件中发生的先后次序又可分为:,DNA水平调控转录水平调控转录后水平调控翻译水平调控蛋白质加工水平的调控,四、真核生物基因表达调控的种类:,第一节 DNA水平的调控,基因丢失,基因扩增,基因重排,DNA甲基化状态与调控,染色体结构与调控,抗体分子的形成Ti质粒转座子,一、基因丢失在细胞分化过程中,通过丢掉某些基因而去除其活性。例如某些原生动物,线虫、昆虫、甲壳类动物,体细胞常丢掉部分或整条染色体,只保留将来分化产生生殖细胞的那套染色体。例如在蛔虫胚胎发育过程中,有27DNA丢失。在高等动植物中,尚未发现类似现象。许多生物各类不同的细胞或细胞核都具有全能性totipotency,第一节 DNA水平的调控,二、基因扩增,在没有发生细胞分裂,整条染色体几乎没有复制的情 况下,细胞内某些特定基因的拷贝数专一性增加的现象1、为满足正常的生长发育需要 如两栖类和昆虫卵母细胞rRNA基因的扩增:卵母细胞中的rDNA拷贝数比体细胞中增加了4000倍,用于转录合成卵裂期所需要的1012个核糖体。在果蝇滤泡细胞中,编码卵壳蛋白的卵壳基因的扩增2、外界环境因素引起基因扩增 基因扩增与肿瘤形成及细胞衰老有关。在原发性的视网膜细胞瘤中,含myc 原癌基因的DNA区段扩增10200倍。许多致癌剂可诱导DNA扩增。,基因组拷贝数增加,即多倍性,在植物中是非常普遍的现象。基因组拷贝数增加使可供遗传重组的物质增多,这可能构成了加速基因进化、基因组重组和最终物种形成的一种方式。,发育或系统发生中的倍性增加在植物中普遍存在,DNA含量的发育控制 利用流式细胞仪对从拟南芥不同发育阶段的组织中分离到的间期细胞核进行分析,发现多倍体的DNA含量与组织的成熟程度成正比。对于一给定的物种,C是单倍体基因组中的DNA质量。,将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,这种方式被称为基因重排。通过基因重排调节基因活性的典型例子是免疫球蛋白结构基因的表达。,三、基因重排:,基因重排,特异性调节,发生在特殊的细胞类型中 例如:酿酒酵母接合型 哺乳动物免疫球蛋白编码区的连接无序的,发生在肿瘤细胞基因组中,1、酿酒酵母接合型的决定,Saccharomyces cerevisiae单倍体细胞,a or 接合型 不同接合型的细胞可以接合 相同接合型的细胞不能接合MATa,MAT接合型可互变a 需要HO基因,编码内切酶,2、Cassette model 匣子模型,(1)接合型互变的匣子模型一个单倍体细胞中同时存在MATa和 MAT在同一染色体上,活跃匣子 MAT 沉寂匣子 HML,HMR,活跃匣子表达,HML和HMR保持沉默?,Sir(silent information regulator),编码阻遏蛋白,其结合位点在HML和HMR启动子上游1500bp以外,在MAT上无结合位点 sir如何控制转录?影响RNA聚合酶的结合 通过染色质浓缩,改变基因转录 DNase I超敏感位点不存在于HML/R上,与活跃匣子不同类型的沉寂匣子可以取代活跃匣子,改变接合型,3 接和型互变,接合型的改变,实际上是DNA序列的代换,依赖于序列同源性与活跃匣子不同类型的沉寂匣子可以取代活跃匣子,改变接合型 匣子 W X Y Z1 Z2 total HML 723 704 747 239 88 2501 MAT 723 704 747 239 88 2501 MATa 723 704 642 239 88 2369 HMRa 704 642 239 1585,四、DNA的甲基化与基因调控:,1、DNA的甲基化,在真核生物中,5-甲基胞嘧啶主要出现在CpG序列、CpXpG、CCA/TGG和GATC中,CpG二核苷酸通常成串出现在DNA上,CpG岛,真核生物细胞内存在两种甲基化酶活性:,维持甲基转移酶,重新甲基转移酶,2、DNA甲基化抑制基因转录的机理,DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,抑制了转录因子与启动区DNA的结合效率。,第二节 染色质水平上的基因活化调节,按功能状态的不同可将染色质分为活性染色质和非活性染色质,所谓活性染色质是指具有转录活性的染色质;非活性染色质是指没有转录活性的染色质。活性染色质由于核小体构型发生构象的改变,往往具有疏松的染色质结构从而便于转录调控因子与顺式调控元件结合和RNA聚合酶在转录模板上滑动。,活性染色质,真核细胞中基因转录的模板是染色质而不是裸露的DNA,因此染色质呈疏松或紧密结构,即是否处于活化状态是决定RNA聚合酶能否有效行使转录功能的关键。,活性染色质的主要特点,在结构上:,活性染色质上具有DNaseI超敏感位点活性染色质上具有基因座控制区活性染色质上具有核基质结合区(MAR序列),活性染色体结构变化,1.对核酸酶敏感,活化基因常有超敏位点,位于调节蛋白结合位点附近。,2.DNA拓扑结构变化,天然双链DNA均以负性超螺旋构象存在;,基因活化后,3.DNA碱基修饰变化,4.组蛋白变化,富含Lys组蛋白水平降低 H2A,H2B二聚体不稳定性增加 组蛋白修饰 H3组蛋白巯基暴露,活性染色质上具有DNaseI超敏感位点。每个活跃表达的基因都有一个或几个超敏感位点,大部分位于基因5端启动子区域。,活性染色质上具有核基质结合区(matrix attachment region,MAR)。MAR一般位于DNA放射环或活性转录基因的两端。在外源基因两端接上MAR,可增加基因表达水平倍以10上,说明MAR在基因表达调控中有作用。是一种新的基因调控元件。,第三节 转录水平的调控,真核生物细胞中有成千上万个基因表达,不同类型细胞由不同组合的基因表达。那么,每种细胞如何保证正确的基因组合表达?一种途径是基因重复:基因有多个拷贝,不同类型细胞表达不同的拷贝,不同拷贝的表达处于不同调控系统。另一种途径是复合控制系统:真核生物单拷贝基因转录调控系统,网络,一、基因转录的顺式调控元件 cis-element,由若干可以区分的DNA序列组成,并与特定的功能基因相连,组成基因转录的调控区,通过与相应的反式作用因子结合,实现对基因转录的调控。按照功能分为启动子、增强子、沉默子按照调控水平分为基础转录水平的顺式调控元件,如启动子;特异诱导高效表达的顺式调控元件,如增强子,1、启动子,UPE:upstream promotor elementUAS:upstream activating sequence,2、Enhancer sv40,促进转录,不具有启动子专一性功能与方向,位置无关远距离发挥作用(100500bp,10Kb)组织或细胞特异性必须有两个(以上)增强子成份紧密相连,enhanson,增强子的特点,SV40至少有3个不连续的21bp的增强子成分A,B,C,6个增强子元,3、silencer,负调控元件,不受距离和方向限制,可对异源基因的表达起作用对真核生物成簇基因的选择性表达起重要作用 例如 酵母,mating type-珠蛋白基因簇T淋巴细胞激活所需要的CD4/CD8基因Sawada S.,1994,A lineage-specific transcriptional silencer regulates CD4 gene expression during T lymphocyte development.Cell 77:917-929对细胞亚型成熟过程中特异性的选择表达,二、基因转录的反式作用因子,调控蛋白质包括负调控因子(阻遏蛋白)正调控因子(转录因子)原核生物调控蛋白种类较少(由于启动子或 操作子结构简单)真核生物调控蛋白种类较多,主要是转录因子,DNA binding domain:100aa,氢键,大沟transcription active domain:30-100aaregular domain:与其它因子或调控蛋白结合,(一)TF结构特征,1、motif 基序,基元,花式,构成任何一种特征序列或结构的基本单位,是超二级结构已发现4种结构基元在DNA结合中起主要作用,补充内容多肽链的构象,,C-N,C-C,螺旋,-折叠,-turn,转角,R1的 C=O与R4的 NH形成氢键,(1)HTH,Helix-turn-helix,2个螺旋被一个转角隔开识别螺旋,与DNA在大沟中特异结合穿过大沟,与DNA非特异结合,许多调控蛋白都有HTH,阻遏蛋白与cro蛋白CAP酵母接合型调控蛋白1,2果蝇的触角足基因 Antp玉米的Kn1水稻的OSH1,(2)Zinc finger,A.Cys2/His2,经典23aaCys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X3-HisCys,His与Zn2+结合形成4面体结构,使中部的氨基酸回折成环,凸出如手指中部芳香族氨基酸保守,疏水串联重复排列,两指间7-8aa锌指数目多少不等,S395,SP1,zyj271,TF III A,344aa,N端与DNA结合9个锌指,每个30aa与5s rRNA基因内启动子(50bp)结合,B.Cys2/Cys2 zinc finger,Cys-X2-Cys-X13Cys-X2-CysZn+与4个Cys结合DNA结合序列较短,对称无大量重复性锌指 Cys2/Cys2与 Cys2/His2不同例如GAL4,酵母的转录因子 哺乳类的固醇类激素受体,糖皮质激素受体,ZYJ272,-COOH,每隔7个氨基酸出现一个Leu,所有Leu出现在同一侧面,成直线排列,形成疏水面,-NH2,富含碱性氨基酸,碱性DNA结合域,(3)Leu zipper,依靠Leu的疏水作用,2个helix 相互缠绕,形成拉链结构,base ZIP motif Y形结构,GCN4,在真核生物中广泛存在,C/EBP 增强子结合蛋白GCN4 酵母激活因子CREB(cAMP应答元件结合蛋白)原癌基因jun,fos编码产物,Leu拉链可以homodimer,heterodimer起作用,说明用各种不同组合,可产生不同的调控蛋白,能阅读多种序列(功能的灵活性),(4)bHLH(Helix-loop-helix),4050aa含2个-helix(1516aa),由连接区(1228aa)连接;两亲性,amphipathic;通过疏水面作用形成二聚体NH2端为碱性结合区,16aa,MyoD-DNA,缺乏碱性区的蛋白质,即使形成(同、异)二聚体,也无法同DNA结合,zyj278,2.转录激活域,A 酸性激活域 如GCN4,GAL4P rich-Gln 如SP1,AP2,oct1,oct2Q rich-pro 如CTF/NF1不规则的,含双性-helix,实验:使用不同的激活域(A,P,Q)与GAL4的结合域构成融合蛋白,检测其激活转录的能力。,DNA结合域只是为激活域在DNA分子上寻找一个立足之地。,酵母双杂交的技术基础,第四节 转录后水平调控,一、hnRNA选择加工及运输实验发现,在海胆囊胚细胞中,约有2万种不同序列的hnRNA,其中1.3万种加工形成mRNA;在成体肠细胞中,约有2.5万种hnRNA,只有3000种加工成mRNA。在囊胚中存在,而肠细胞中没有的mRNA序列,大多数可在肠hnRNA中发现。说明海胆中许多基因的转录并不因组织的不同而有很大的差异。不同组织调控自己mRNA水平的主要方式似乎不在转录水平,而在对hnRNA的选择加工,似乎只有一小部分基因的调控发生在转录水平。,除了转录水平调控外,mRNA水平还决定于hnRNA加工、mRNA运输,但对其机制了解不多,hnRNA 核内不均一RNA hnRNP 与RNA结合蛋白形成核糖核蛋白,蛋白质3/4 加工 5-capping,3-polyA,splicing,RNP复合物中的蛋白质组分可能包含了各步骤所需的酶 mRNA,mRNP 在细胞质中与蛋白质结合存在,二、alternative splicing,1、概念组成型剪接:一个基因的mRNA前体按一种方式剪切,产生一种mRNA,一种蛋白质选择性剪接:有些基因的mRNA前体,按不同方式剪切,产生两种以上mRNA,翻译产生多种蛋白质2、产生原因及类型有两个以上的启动子,未发现实例有多个加尾信号,如免疫球蛋白选用不同的拼接位点,如SV40的T,t抗原几者兼有,如大鼠降钙素基因相关产物,果蝇,性别决定,免疫球蛋白,不同3末端型,大鼠降钙素,calcitonin,ylf420,Calcitonin gene related peptide,三、调控机制,实质是5供体与3受体拼接点的选择搭配如何选择不同的位点?SR蛋白家族:SF2剪接因子,可与RNA 结合,决定5剪接位点 RNP的调节:hnRNP-A1,U5-snRNP,Intron的功能之一是使同一个基因表达出多种蛋白质,即扩大DNA中遗传信息的含量 高等真核生物基因组很大,完全能容纳更多的基因。为什么一方面它的许多基因非常分散,而另一方面它又使一个基因产生出多种产物?,四、选择性剪接的意义,令人不解!?,由于可变剪接机制的多样化,一个基因可以在转录后通过hnRNA的剪接加工而产生两个或更多的蛋白质。因此基因的定义也应随之扩展,即不应以多肽产物为单位,应以独立转录的一段DNA作为确定一个基因的标准?,转录调控实例,1.组成性转录因子:SPl SPl与一段富含GC的保守序列GGGCC沿相连,是一种组成性转录因子。SPl存在于所有的细胞类型中,包含3个锌指结构以及2个富含谷氨酰胺转录激活结构域。SPl的富含谷氨酰胺结构域与TAFll0发生特异性作用,而TAFll0与TATA结合蛋白(TBP)相结合组成TFD。这就是SPl如何调控起始转录复合体的一种方式。,2.激素调控:,类固醇激素受体 激素由一类细胞分泌,然后将信号转移给另一类细胞。如类固醇激素是脂溶性的,可以穿过细胞膜与被称作类固醇激素受体的转录因子相互作用。在没有类固醇激素存在的条件下,该受体与抑制蛋白结合,游离在细胞质中,对转录有阻抑作用。当类固醇激素与受体结合后,可以使受体从抑制蛋白上游离出来,然后受体二聚化,进而转移到细胞核中,转化为转录激活因子。,3.磷酸化调控:STAT蛋白,某些激素不穿过细胞,它们与细胞表面的受体结合,通过信号转导的过程将信号传递给细胞内的蛋白。如-干扰素通过激活JAK激酶,诱发转录因子(STATl)的磷酸化(当STATl没有磷酸化时,以单体的形成存在于细胞质中,没有转录活性)。它的一个特定酪氨酸残基发生磷酸化后,便能够形成同型二聚体,并从细胞质转移到细胞核中,进而激活在启动子处含有一保守DNA结合序列的目标基因的表达。,4.转录延伸:HIV Tat,HIV编码一种称为Tat的激活蛋白,该蛋白为HIV基因的大量表达所必需。Tat与RNA上的一段称为TAR的茎环结构结合(TAR是HIV RNA5端的转录起始点后的一段不翻译区域)。在哺乳动物细胞中Tat所起的主要作用表现在转录延伸的过程中,若没有Tat的存在,RNA聚合酶转录复合体将因进程过慢而使HIV的转录过早终止。,Tat可与RNA结合因子一起以复合体形式结合在转录物的TAR序列上,Tat-RNA复合体可以向后成环,并与装配在启动子处的新形成的转录起始复合体作用,这种作用导致TFH的激酶活性被激活,结果RNA聚合酶的羧基端结构域(CTD)实现磷酸化,使得RNA聚合酶前进,完成HIV转录单位的阅读,实现HIV蛋白的大量合成。,5.胚胎发育:同源域蛋白,同源框是一段保守的DNA序列,编码一种同源异型域的螺旋-转角-螺旋的DNA结合蛋白。果蝇同源异型基因编码的转录因子中的同源异型域负责身体各部分的正确分化。例如,同源异型基因中的一种Antennapedia的突变可使果蝇在应该长触角的地方长出腿来。,第五节 翻译水平的调控,一、翻译起始因子的磷酸化二、mRNA结构三、mRNA稳定性四、pro.合成的自体调控,例,转铁蛋白mRNA的翻译调控,(1)TfR(transferrin receptor),用于铁的运输铁含量高时,TfR合成减少 低时,TfR合成增加IRE,在3-UTR区,与IRE-BP结合稳定mRNA,(2)Ferritin,铁蛋白,用于铁的解毒铁含量高时,ferritin合成增加 低时,ferritin合成减少IRE,在5-UTR区,与IRE-BP结合阻止翻译,ZYX231,IRE-BP与顺乌头酸酶同源性高,是一种铁硫蛋白 4Fe4S 3Fe4S,不能与IRE 结合,第六节 翻译后水平的调控,翻译后产生的多数蛋白质无生物活性,必须经过切割加工、水解、化学修饰、剪接某些蛋白质有选择的受到抑制某些蛋白质必须位于细胞内特定位置,如溶酶体、线粒体、叶绿体需同其他蛋白质结合,组装成功能单位,如血红蛋白、微管蛋白、核糖体等,都是由多条蛋白质分子结合在一起形成的功能单位,一、Molecular chaperone,1961年,Anfinsen发现变性RNaseA分子在体外自发折叠成天然构象。蛋白质的三级结构是根据氨基酸序列自发形成的。1978年,Laskey发现 Histon-nucleosome nucleoplasmin核质蛋白 1980年,Ellis.发现 8 subunits of Rubisco active Rubisco a binding pro.,chaperone:A functional class of related families of proteins that assist the correct non-covalent assembly of other polypeptide-containing structure in vivo,but are not components of these assembled structure when they are performing their normal biological functions.,二、分子伴侣的种类,ZYX353,三、分子伴侣的功能,胁迫保护:帮助多肽正确选择折叠、组装的途径,如胁迫保护、热激后HSP70从细胞质运到核内,防止核蛋白失活转运蛋白:防止过早折叠,帮助越膜、转运 消除过早和过多的折叠,有助越膜调节基因转录,DNA复制协助组装细胞骨架,四、分子伴侣的作用机制,识别:一般与暴露于表面的疏水基团结合,有一定特异性结合:以非共价方式,短暂地同新生多肽、非组装的或非折叠的蛋白质结合,从而阻断蛋白质与蛋白质之间的作用,防止其相互聚集或错误折叠,使其按天然状态折叠解离:具有ATPase是解离的必要条件,真核生物主要采用正控制模式,无调节蛋白存在时,基因关闭有调节蛋白存在时,基因开启真核RNA pol 对其启动子的亲和性转录的启动是依赖多种激活蛋白的作用(与多个顺式元件结合),真核生物正调控的必要性和优越性,特异性:真核基因组很大,某种顺式元件出现的几率高.这种情况下,保证基因特异表达的方法之一是使用多个调控蛋白,并同时与顺式元件结合形成复合物,才能启动转录,而且必须是正调控.如果是负调控,只要有一个调控蛋白与顺式元件结合,即可关闭基因.一个多细胞生物基因的调节位点(顺式元件)至少是5个.由于一种顺式元件可与多个调控蛋白结合,几个不同的顺式元件以适当有功能的方式排列在一起的随机性几乎没有.也保证了基因的特异性表达.经济:在分化了的细胞中,只须表达一部分(套)基因,其他的关闭.例如有100个基因,10%表达,90%关闭.如果是负控制,须90种阻遏物;如果是正控制,只须10种激活物.减轻蛋白质合成的负担,原核生物与真核生物基因 表达调控机制具有惊人的相似性,共同的起源与共同的分子基础,调控机理上,调控层次上,原核与真核生物基因表达的差异,Repeatitive gene Overlapping gene,Splitting gene no intron,DNA+histon chromatin Naked DNA,enhancer&silencer Attenuater,monocistron polycistron(operon),Eukaryote Prokaryote,