植物生理学专题.ppt
植物生理学专题(六)植物生理与分子生物学,二、高等植物基因结构及表达调控,1、真核基因组结构特征2、植 物 的 基 因 组3、植 物基 因 的结构4、植物基因的表达调控,1、真核细胞基因组结构的特征,真核基因是单顺反子(cistron),一条成熟的mRNA链只能翻译出一条多肽链。原核生物是多基因操纵子。,真核生物 rRNA 基因结构,ETS,ITS,不转录间隔,18S,5.8S,28S,45S rNA前体,rRNA基因,真核rRNA基因是多考贝(中度重复序列);三种rRNA基因总是按18S、5.8S、28S 顺序排列;此基因簇是串联重复的,簇与簇之间由不转录间隔分开;间期核中rDNA浓缩成核仁,在核仁中被转录、加工。,18S 5.8S 28S,核小体,DNA 核小体 螺线管 超螺线管 染色单体,真核基因组是以染色体形式存在,小部分DNA是裸露的。,DNA(基因),mRNA,编码区,尾部区,起始密码,终止密码,extron,intron,前导区,真核基因组中存在着高度重复序列。高度重复序列;中度重复序列;单一序列。,真核基因属于断裂基因,编码序列中存在有内含子。,真核生物能够根据生长发育阶段的需要进行DNA的重排和基因扩增。,真核基因转录调控区很大,可远离启动子上千个碱基。真核基因的表达转录和翻译存在着时间和空间间隔。真核基因表达的调控可从染色体结构至翻译后加工多个层次(水平)上进行。,原核生物基因表达,真核细胞基因表达,2、植物的基因组,基 因(gene)?基因组(genome)?基因组学(genomics)?,遗传物质单元,在染色体上占据特定位置、具有某种特定遗传功能的 DNA 序列。编码一个完整mRNA的一段DNA序列。,基因可分为:结构基因:编码蛋白质的基因。包括编码酶和结构蛋白的基因;调节基因:编码作用于结构基因的阻遏蛋白或激活蛋白的基因;没有翻译产物的基因:RNA基因,转录成为 tRNA和rRNA基因;不转录的DNA区段:调控序列,如启动区、操纵基因等等。(顺式作用元件),基因组:一个生物遗传物质的总和。细胞中的全部DNA。,植物的基因组:细胞核基因组+细胞质基因组,叶绿体基因组+线粒体基因组,基因组学:研究基因组的结构、功能和进化的科学。,2.1 植物基因组的复杂性,(2)植物基因组的长度差异是整个生物界最大的;拟南芥单倍体基因组:6.3107 bp;百 合单倍体基因组:1.01011 bp;,(3)植物基因组中重复序列变化极大;拟南芥和一些多倍体植物中:20%;小麦、豌豆中,80%以上基因是重复序列;,(1)植物除了细胞核基因组外,还有细胞质基因组;,一些物种细胞核基因组(二倍体)大小,基因组的序列可分为单一序列(single copy sequence)和重复序列(repetitive sequence);,基因组的复杂性是指基因组中不同序列的总和,用DNA变性和复性实验检测;可用参数:Co t1/2 表示;,Co:复性时相同DNA的浓度;t:复性的时间 一半DNA复原成双链所用的时间,基因组越复杂,Co t1/2 值越大。,叶绿体基因组(chloroplast genome):,多数植物 cpDNA在120160kb之间;含有87183个已知基因;,烟草 86684,25339,18482,25339,LSC,SSC,IRA,IRB,rRNA,rRNA,4 rRNA基因、30 tRNA基因、4 RNA聚合酶基因、21核糖体蛋白质基因、31光合作用相关基因、40其它蛋白质基因。,线粒体基因组(mitochondrial genome),mtDNA长度变异要比cpDNA大得多,1952600kb;动物mtDNA为1518kb;真菌在1878kb;基因组的大小并不表示基因数量的多少:,拟南芥mtDNA 376kb,人mtDNA为16.6kb,前者比后者RNA基因多1个,蛋白质基因27:13。在同一细胞 中可有不同长度的mtDNA。,也有基因从核基因组转移至细胞器基因组:核糖体L23蛋白质基因。,mtDNA有分子内、分子间重组,也可与核、叶绿休基因组DNA重组。因此mtDNA的重排、序列加倍、与外源DNA整合的几率很高,由此产生新的嵌合基因。细胞质雄性不育就是由于新的嵌合基因导致的。,植物细胞内的三类基因组存在着广泛的相互作用。叶绿体和线粒体的结构蛋白多数由核基因组编码:细胞器基因 转移至核基因组;,叶绿体、线粒起源:马古利斯的内共生理论,分子生物学证据:1、线粒体和叶绿体仅能来自已有的线粒体和叶绿体;2、基因组结构与原核生物相似;3、有自已的蛋白质合成体系,且与原核生物相似;4、能抑制细菌RNA聚合酶的抗生素也能抑制线粒体 和叶绿体RNA聚合酶。5、叶绿体基因结构中有象细菌那的启动子、操纵子结构。,2.2 基因组学简介,1995,第一个细胞生物,流感嗜血菌基因组1.8Mb测序完成;1996,第一个真核生物,啤酒酵母基因组12Mb测序完成;1998,第一个动物,美丽线虫基因组(97Mb)测序完成;2000,第一个昆虫,果蝇基因组(120Mb)测序完成;2000,第一个植物,拟南芥基因组(125Mb)测序完成;2001,第一个哺乳动物,人的基因组(3100Mb)测序完成;2002,第一个重要作物,水稻基因组(430Mb)测序完成;,599病毒,205种自然质粒,185种细胞质基因组,31种细菌;,基因组学研究的具体内容有:(1)建立以互联网为平台的数据库;(2)组建基因组的物理图谱和遗传图谱;(3)确定基因及基因组的序列;(4)分析基因组的结构特点;(5)鉴定基因组中所有基因,并确定其功能;(6)建立基因表达数据库;(7)建立基因及表型之间的关系(功能基因组学);(8)确定DNA的复杂性;(9)为比较不同生物的基因组提供资料;,世界上有三大基因序列数据库:美国“国家生物技术信息中心”(NCBI)主持的Gene Bank:http/,“欧洲生物信息学研究所”(EBI)主持的EMBL数据库;http/,日本“国家遗传学研究所”(NIG)主持的日本DNA数据库(DDBJ)http/,基因的命名:,植物基因命名委员会:Commission on Plant Gene Nomenclature,CPGN 根据基因序列,把植物基因分成不同的家族;CPGN规定:基因符号最多8个:XyzN,核基因组基因;xyzN,细胞质基因组基因,根据突变型的表型命名:基因名称与正常功能相反;矮化基因高生长基因,基因符号用三个斜体字母表示,基因产物用正体大写:突变型基因用小写:abc 野生型基因用大写:ABC ABC是该基因的产物 Abc+指 ABC 基因的表型(野生型);Abc-指 abc 基因的表型(突变型);,ABC1 和 ABC2 是不同的基因;abc4-1 和 abc4-2为相同基因的不同等位基因;,3 植物基因的结构,克隆植物中编码蛋白质基因的方法:根据蛋白质测序结果,合成一段寡聚探针,从该植物的基因组文库与 cDNA(complementary DNA)文库中分别钓出编码该蛋白质的基因与 cDNA克隆。,某种生物全部基因的克隆总体基因组文库,克隆与基因组文库的构建,文库的构建,cDNA,探针是一段与目的基因有互补序列的用放射性同位素(32P)标记的 DNA 或 RNA分子。,利用“探针”分子钓取目的基因,构建基因文库的目的主要是为了直接从基因组中分离目的基因,有了基因文库后,目的基因的制备可以理解为从基因文库中“钓出”目的基因。,两条来源不同的具有一定同源性(即具有碱基互补关系)的DNA单链分子或DNA单链与RNA分子经退火形成双链DNA分子或DNA-RNA异质双链分子的过程称为核酸分子杂交。,核酸分子杂交,电泳分离,转膜,探针杂交,放射显影,根据蛋白质测序结果,合成一对 PCR 引物,以植物总DNA为模板,扩增出目标基因片段,以此片段为探针,从基因组文库与 cDNA文库中分别钓出编码该蛋白质的基因与 cDNA克隆。,基因产物不明,但知道基因突变后的表型,可用转座子标签法分离基因。,显性纯合子,隐性纯合子,杂合子显性表型,杂合子突变表型,隐 性突变株,正常未突变株,基因组文库 I,基因组文库II,转座子探针,带转座子DNA片段,完整目的基因,亚克隆探针,利用RFLP图谱,找出与所要克隆基因紧密连锁的分子标记,用染色体步行法找到所要克隆的基因。,A,B,已知基因,未知基因,步行探针,间隔100Kb,核DNA减法克隆。利用缺失突变体与同源亲本12DNA片段的差异克隆目的基因。,如果该基因受某种因素诱导表达,可用mRNA差异显示法找到所要克隆的基因。,通过对比研究,表明植物基因结构与其它真核基因结构相似,主要由4个结构区域组成。5上游区、5非翻译区、编码区、3非翻译区,克隆到基因与cDNA后,测序,对比基因全序列与 cDNA序列,了解基因结构:如转录起始位点,内含子数量、位置及长度,终止密码与加尾信号的位置等。,5上游区,5非翻译区,编码区,3非翻译区,终止序列,高等植物基因结构,启动子,3.1 5上游区:,转录起点5端上游一段很长的区域,包含启动子在内的与基因表达起始和表达调控有关的许多元件。,NNNNNNCTCATCANNN,+1,+7,8,该区域结构特点是:基因启动区序列中,在转录起点附近有一一致序列(consensus sequence):CTCATCA,其中的一个A 为转录起始核苷酸,此A编为+1,转录本中为正数,此A 的上游用负数表示。,在上游 32 7有一段TCACTATATAG一致顺序:简称:TATA box。该序列是RNA聚合酶II起始转录所必需的。,在 75 附近 处常有GC(T/C)CAATCT一致序列,简称CAAT box,确定RNA聚合酶结合部位,具有增强基因转录的作用。,在5远上游区,存在对基因表达有增强或抑制作用、决定基因表达特定时空顺序以及对激素和外界胁迫起应答作用的序列 顺式作用元件(cis-acting element),转录起点到 CAAT box 附近这一区段称为启动子。,GC box:-110附近的GGGCGG保守序列,确定RNA聚合酶结合部位。,3.2 5非翻译区:,转录起点到翻译起始密码子之间的序列。该序列 5端是前体 mRNA 加帽位点。,5非翻译区,3.3 编码区:,起始密码到终止密码之间的序列。有时专指外显子(extron)部分。多数植物基因转录本 5 有一个起始密码AUG,少数植物 5 有4个AUG。翻译起点的共有序列:植物:C(G)AANNATGG 动物:A(G)NNATGG,转录的基本原则碱基互补:A=T G=C A=U,也称“GT-AG法则”,编码区中常有数目不等的内含子(intron)。外显子与内含子交界处共有序列是:外显子 AG GTAAGT 内含子 TCNAG G 外显子,外显子中4种碱基比例:单子叶植物:AT含量 43%;双子叶植物:AT含量 54%;,内含子共有4种,具有核酶性质:I 类内含子:主要存在于rRNA和质体tRNA基因 中,中间部分高度保守;II 类内含子:主要存在于线粒体和质体mRNA基 因中,拼接点的序列高度保守;III 类内含子:主要存在于核mRNA基因中;IV 类内含子:存在于核tRNA基因中;,3.4 3非翻译区:,3末端有转录本mRNA的加尾信号:AATAAA,A98A86T98A98A95A96,终止密码后的序列,也有一些调控序列,对mRNA的稳定性和翻译效率起调节作用。3种终止密码使用的频率为:单子叶植物:TGA 46%,TAA 28%,TAG 26%双子叶植物:TAA 46%,TGA 36%,TAG 18%,前导区,编码区,尾部区,DNA,+1,起始密码,终止密码,信号肽序列,加尾信号,mRNA,5 端帽子结构m7G 5PPP 5 NP,3 端polyA尾巴 20200 base,真核细胞 mRNA 的结构,4 植物基因的表达调控,真核基因表达调控的显著特征是:能在特定时间、特定空间的细胞中激活特定基因,从而实现“预定”的、有序的、不可逆的分化、发育过程;并使生物的组织、器官在一定的环境条件范围内保持正常功能。,大肠杆菌乳糖操纵子结构,根据调控的性质可分:瞬间调控可逆调控。相当于原核细胞对环境条件变化做出的反应。包括某种底物或激素水平升降时,对细胞周期不同阶段中酶活性和浓度的调节。,生长发育调控不可逆调控。真核基因调控的精髓部分,基因按“预定”的时、空间顺序表达,从而实现生长、分化、发育的全过程。,在植物的生命周期中,基因表达具有时空专一性(生长发育进程专一性和细胞、组织、器官特异性),同时受环境因素的影响。,确定某种基因在何种组织专一表达的方法:,以基因编码区中一段序列为探针,从不同组织或器官中提取总 mRNA,进行Northern杂交。,Northern杂交技术用于检测特异性mRNA的存在。mRNA 样品经电泳分离后,转移到硝酸纤维素膜上,与 DNA 探针进行杂交,即可检测特异性mRNA分子在样品中存在与否,量的多少。,mRNA,mRNA,电 泳,DNA probe,转 膜,Northern杂交技术广泛用于研究特异性mRNA分子在细胞处于不同条件下发生量和质的变化,或不同组织器官中基因表达的差异。,Northern 原位杂交,指在细胞、组织切片上直接进行分子杂交,通过检测细胞内特异mRNA的存在与否来了解哪些细胞中有特异基因的表达。,整个过程包括材料的预处理、细胞固定、细胞的 DNase 酶解(降解DNA,减少非特异性杂交)杂交、检出。,将待测基因的启动子序列与一报告基因的编码区及3端终止区连接,建成融合基因,经转化植物细胞得到再生植株后,检测报告基因在何种组织与细胞中表达。常用的报告基因有:GUS基因、CAT基因等,用基因编码的蛋白质制备出抗体,对植物不同组织切片进行免疫杂交。(Western蛋白质杂交技术),4.1 器官、组织专一性表达的基因,HRGP 基因:编码富含羟脯氨酸糖蛋白(Hydroxyproline-rich glycoprotein HRGP),主要在茎栅状细胞、表皮细胞中表达。,rbcS 基因:编码 Rubisco 小亚基,在叶肉细胞、保卫细胞、中脉与绿色组织细胞中表达。,P2基因:编码一种参与花粉管萌发生长的蛋白质,只在雄蕊成熟花粉与花粉管中表达。PAL2基因:编码PAL,参与花色素形成,只在花瓣中表达。Gy4基因:编码大豆贮藏蛋白,只在胚乳组织中表达。Amyl基因:编码-淀粉酶,种子萌发时,在糊粉层表达。,4.2 受环境影响而表达的基因,HSP 基因:编码 8090、6575、1530kD 几种热激蛋白。热胁迫时,HSF单体在核内组装成三聚体,与DNA 的 HSE(热激元件)结合,刺激HSP-mRNA转录,翻译成HSP。HSP参与生物体内新生肽的运输、折叠、组装、定位以及变性蛋白的复性和降解。,HSP功能:维持变性蛋白质的可溶性,使变性蛋白重新折叠成有活性的构象,提高蛋白质(酶)热稳定性。,热激因子(HSF)循环激发热激蛋白(HSP)mRNA的合成,双子叶:20单子叶:11,低温诱导基因,低温超量表达基因;不包括低量、瞬时表 达 基 因。,同工蛋白(isoform)抗冻蛋白(antifreeze protein AFP)类脂转移蛋白(lipid transfer protein LTP)胚胎发育晚期丰富蛋白(LEA),低温诱导基因:植物经低温诱导能使某些特定的基因活化,表达合成一组新蛋白(Cold acclimation protein)。,低 温 诱 导 基 因,拟南芥中的冷调节蛋白 COR6.6、油菜的BN28 蛋白与鱼类抗冻蛋白有同源性,体外实验表明冷调节蛋白能减少冻融过程对类囊体膜伤害。拟南芥叶绿体的 CORl5 蛋白在体外能有效地防止乳酸脱氢酶因冰冻而失活,其效率较蔗糖高出106倍,较其它蛋白高102倍103倍。,抗冻蛋白(AFP):一种能降低细胞间隙体液冰点的糖蛋白。,水分逆境诱导的基因:,水分胁迫会诱导一些特定的基因表达,合成新蛋白质水分胁迫蛋白(water stress protein)。这类蛋白质多数是高度亲水的,能增强原生质的水合度,起到抗脱水的作用。,水分胁迫蛋白的功能可能还包括对膜结构的保护、恢复一些蛋白质的活性和形成特定的水、离子通道(如水孔蛋白),改变或调节液泡和细胞质中的s等。,病菌感染诱导的基因:病原物侵染能刺激植物致病相关基因表达,合成与正常组织不同的新蛋白,称为“病程相关蛋白”(PR)。几丁质酶基因、葡聚糖酶基因、PAL基因、CHS基因等。,创伤诱导的基因:植物受伤后一些基因往往被诱导表达,如土豆中的蛋白酶抑制剂II基因,其表达产物抑制多种微生物和昆虫蛋白酶活性。,4.3 植物基因表达调控机理,(1)调控的特点(方式):染色质水平的调控;以正调节为主,具有多个调控序列;调控区很大,远离启动子几百至上千个bp;存在多种转录后的调控机制;具有细胞特异性或组织特异性表达;,(2)顺式作用元件与基因调控,植物基因的调控主要在转录水平上进行,受特定顺式作用元件(cis-acting element)和反式作用因子(trans-acting factor)影响。,基因转录所需的顺式作用元件主要是:启动子(promoter)和增强子(enhancer);,启动子:,核心启动子(core promoter):是决定转录起始位置的关键序列,也是普通转录因子TFD的结合位点。TATA box:位于转录起始点上游-25-30bp。起始子(initiator,Inr):是与转录起始位点重叠的短的较保守序列,与基因转录启动有关的一组DNA序列,位于转录起始点上游-100-200bp以内,其功能是决定转录的起始位点和调控转录频率,上游启动子元件:(Upstream Promoter element,UPE)位于较上游(-30-110bp),能较强影响转录起始的频率,如 CAAT box 和 GC box。其中GC盒是转录因子 SPl 的结合位点。,增强子(enhancer):能显著提高基因转录效率的一类顺式调控元件(其核心序列常为 812bp),增强效应十分明显;可使基因转录频率增加10100倍,有的可达上千倍;,增强子的作用特点:,增强效应与其位置和取向无关;增强子提高同一条DNA链上基因转录效率,可以远距离起作用,通常可距离1-4kb、有时远离30kb仍能发挥作用,而且在基因的上游或下游都能起作用。增强子的作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。,增强子没有基因专一性;增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。,当增强子移位时,能提高新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。,增强效应有组织和细胞专一性;增强子必须与特定的蛋白质因子结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有特异性蛋白质因子所决定的。,许多增强子还受外部信号的调控;如热激蛋白基因的表达。金属硫蛋白基因上游增强子能对环境中的锌浓度做出反应。,左手双螺旋,主链中各个磷酸根和糖骨架呈锯齿(Zigzag)状排列,因此称Z-构象。,Z-DNA,增强子的增强原理:,Z-DNA只有一个螺旋沟,相当于B构象中的小沟,狭而深,大沟则不复存在。,(2)Z-DNA,Wang和Rich等在研究人工合成的d(CGCGCG)单晶的X-光衍射图谱时,发现这种六聚体的构象不同于B-构象。,它是左手双螺旋,主链中各个磷酸根和糖骨架呈锯齿(Zigzag)状排列,因此称Z-构象。,应答元件(responsive elements)真核细胞中对某些特定的环境作出应答的基因,常具有相同的顺式元件应答元件。RNA Pol的诱导型转录因子结合部位。,沉寂子(silencer):负调控元件是能抑制基因表达的序列,使基因沉默。,(3)反式作用因子与基因调控,反式作用因子(trans-acting factor)是通过识别和结合顺式调控元件的核心序列而调控靶基因转录效率的一组蛋白质。反式作用因子对基因表达的调控可正(激活)可负(阻遏)。,所有顺式作用元件都要与相应的反式作用因子结合,并通过蛋白质之间的作用才能实现对基因转录的调控。,RNA pol II 的相关转录因子有三类:,基础因子,也称通用因子(TF):TFD,TFB,TFF,TFE,TFH 等;TAF:转录调控辅助因子,与多种转录调控因子(激活物或阻遏物)的转录调控结构域结合,而介导转录激活或抑制。诱导型因子:与应答元件结合。,RNA聚合酶的基本转录因子,RNA聚合酶转录复合体的形成示意图,(4)DNA甲基化与基因表达,DNA的CpG顺序上中第位点被甲基化,主要位于上游调控区内。维管植物DNA中约有1/3C甲基化。,高度甲基化:基因持续失活;诱导去甲基化:如时、空特异性表达基因;持续低水平甲基化:有转录活性如持家基因。,持家基因(housekeeping gene):是指对所有类型组织细胞在任何时候都需要其表达的基因,通常都是维持细胞基本生存所必须的基因,其表达常保持在固定的水平。又称为组成性基因(Constitutive gene)。,(5)染色质活化与基因表达,间期核染色质,异染色质heterochromatin,常染色质euchromatin,较为松散,约10%为活性染色质(更开放疏松),高度压缩(不转录),DNase,对 DNase 高度敏感点,(6)转录后水平调控,在核内对 hnRNA(heterogeneous nuclear RNA)进行各种修饰、剪接和编辑,使外显子部分连接成为一个连续的开放读框(open reading frame,ORF)的过程称为转录后加工。hnRNA与蛋白质结合形成核异质性核糖核蛋白(hnRNP),mRNA前体的加工在hnRNP上进行。,5-端加帽(capping):,hnRNA 5-端鸟苷甲基化 m7GpppNp 帽子结构的作用:使mRNA更稳定;增加蛋白质合成的效率;帽子结构对mRNA前体的剪接是必需的;,真核mRNA的5-“帽子”结构通常有三种类型:m7G5ppp5Np;m7G5ppp5Nmp m7G5ppp5NmpNmp。,3-端加尾(poly(A)):,hnRNA 3端接上一个约200 250个腺嘌呤核苷酸(A)的尾巴。poly(A)尾巴的作用:有利于mRNA通过核孔;参与稳定mRNA;增强翻译效率。,hnRNA的剪接 剪除内含子,并将外显子连接。,典型的真核mRNA的结构顺序是:5-帽子结构-非编码区-起始密码-编码区-终止密码-非编码区-polyA尾巴-3,(7)翻译水平调控,影响翻译效率的因素有:蛋白质因子和tRNA浓度;起始因子的可逆磷酸化作用;mRNA结构5端帽 子和 3端poly(A)尾巴;mRNAR 的稳定性。,(8)翻译后调控,氨基酸侧链的共价修饰:乙酰化、磷酸化、糖基化;蛋白质前体的切割和成熟。蛋白质的分泌和胞内定位 信号肽:指导蛋白质运输到正确位置。,思考题,1、试述高等植物基因的基本结构。2、简述高等植物基因表达调控的基本特征及调控方式。3、逆境蛋白的产生与植物的抗性。,