基因组的结构特点课件.ppt
基因组的特征,原核生物基因组 真核生物基因组 病毒基因组,第二章 原核生物基因组,第一节 原核生物基因组的一般特征,1.原核生物的基因组为DNA分子,只有一个复制起始点.,较小,在106-107之间,通常为一条环状双链DNA分子,基因组DNA与支架蛋白和RNA结合,形成类核.,大肠杆菌类核结构照片图,原核生物类核结构示意图,类核结构由中央和外围组成,原核生物的类核结构,类核(nucleoid)原核生物基因组DNA位于细胞的中央区,与支架蛋白和RNA结合在一起,以复合体的形式存在,经高度盘旋聚集形成一个较为致密的区域,称为类核。,2.广泛存在操纵子结构,指数个功能上相关的基因串联在一起,连同上游的调控区和 下游的转录终止信号,构成一个基因的表达单位.,乳糖操纵子,阿拉伯糖操纵子,色氨酸操纵子,乳糖操纵子(lac operon)的结构,原核生物的多顺反子,真核生物的单顺反子,目 录,3.原核生物的结构基因.,基因是连续的,无内含子,编码区在基因组中的比例,真核基因组 病毒基因组,多数为单拷贝基因,基因组中重复序列很少,4.编码序列一般不重叠.,50,噬菌体174基因组示意图,基因重叠(gene overlapping),指基因组DNA中某些序列被两个或两个以上的基因所共用。这些基因序列之间互相有重叠,所以称基因重叠(也称重叠基因)。,5.具有编码同工酶的不同基因,6.GC含量差异大,7.非编码区内主要是一些调控序列,8.具有可移动DNA序列,复制、转录起始区 复制、转录终止区,插入序列、转座子、质粒,质粒的概念,质粒(plasmid),是细菌细胞染色体以外的能独立复制并能稳定遗传的共价闭合环状DNA分子(covalently closed circular DNA,cccDNA)。,原核生物的转座因子,转座子的分类1.插入序列(insertion sequence,IS)组成:700-2000bp 一个转位酶基因 两侧的反向重复序列2.转座子(transposon,Tn)组成:4500-20000bp 转座酶基因 抗性基因3.Mu噬菌体 具有转座功能的温和性噬菌体。能整合到宿主基因组内引起突变。,1.插入序列(insertion sequence,IS):7502500 bp 两端反向重复序列,与插入有关 中心序列有转座酶基因,2.转座子(transposon,Tn):200025000 bp 两端为IS 中心序列有与转座无关基因 如:毒素基因、耐药基因等,转 座,由插入序列和转座子介导的基因移位或重排称为转座(transposition)。,大多数基因在基因组内的位置是固定的,有些基因可以从一个位置移动到另一位置。,基因转移的方式,1.细菌的接合(conjugation)又称“细菌杂交”,是遗传物质通过细胞间的直接接触而进行的转移和重组。2.细菌的转化(transformation)受体菌直接吸收来自供体菌的DNA片段,通过交换将其整合到自身的基因组中,从而获得供体菌部分遗传性状的现象。,3.转导(transduction)是以噬菌体为媒介把细菌的基因从一个细菌细胞转移到另一个细菌细胞的过程。4.转座(transposition)指遗传物质被转移的现象。,1.接合,当细胞与细胞、或细菌通过菌毛相互接触时,质粒DNA从一个细胞(细菌)转移至另一细胞(细菌)的DNA转移称为接合(conjugation)。,可接合质粒如 F 因子(F factor),2.转化,通过自动获取或人为地供给外源DNA,使细胞或培养的受体细胞获得新的遗传表型,称为转化(transformation)。,例:溶菌时,裂解的DNA片段被另一细菌摄取。,3.转导,当病毒从被感染的(供体)细胞释放出来、再次感染另一(供体)细胞时,发生在供体细胞与受体细胞之间的DNA转移及基因重组即为转导作用(transduction)。,*转染(transfection),转染是转化的一种特殊形式。由transformation(转化)和 infection(感染)两词构成。通过感染方式将外来DNA引入宿主细胞,并导致宿主细胞遗传性状改变的过程称为转染。将任何类型DNA转移至真核细胞内的过程均可叫转染。,原核生物基因组的结构特征,1.基因组DNA分子量较小 2.64109Da位于细胞中央,形成一个致密的区域,称为类核(nucleoid)。2.存在操纵子(operon)结构。3.结构基因是单拷贝,连续排列没有内含子成分。4.编码顺序一般不重叠。5.具有编码同工酶的不同基因。6.基因组编码区占50左右。7.存在多种功能的识别区,常以反向重复序列存在。8.存在可移动成分。,第三章 真核生物基因组,第一节 真核生物染色体基因组,一、真核生物染色体基因组的一般特征二、单拷贝基因三、重复序列四、基因家族五、端粒和端粒酶六、基因移动七、果蝇基因组概述,一、真核生物染色体基因组的一般特征,1.基因组庞大 2.线状双链DNA和二倍体3.非编码区远多于编码区4.断裂基因(split gene)5.存在大量重复序列,二、单拷贝基因,单拷贝基因:基因组中仅出现一次的基因 特点:(一)单顺反子(二)断裂基因:内含子(intron),外显子(exon),原核生物的多顺反子,真核生物的单顺反子,目 录,三、真核生物基因组的重复序列,(一)高度重复序列(重复次数:1O5)(二)中度重复序列(重复次数:1O 1O5),Types of repeat,重复序列,(一)高度重复序列(重复次数lO5)约占10-60,在人基因组中约占20 1.卫星DNA(Satellite DNA)2.反向重复DNA:回文结构:GGTACC CCATGG 常见于基因的调控区和特异蛋白结合区。,卫星DNA(Satellite DNA),卫星DNA(satellite DNA),1大卫星DNA(macro-satellite DNA)重复单位5100bp;2小卫星DNA(mini-satellite DNA)重复单位670bp;VNTR 3微卫星DNA(micro-satellite DNA)重复单位26bp;STR,可变数目串联重复序列,Variable number tandem repeat,VNTR 又称小卫星DNA(minisatellite DNA)短重复单位(6-70bp)串联重复(6-100次以上)VNTR多态性分子标记DNA指纹图(fingerprint),微卫星DNA(microstallite DNA),重复单位:2-6个核苷酸;串联重复(10-60次),两侧为特异的单拷贝序列。短串联重复:Short tandem repeat,STR双核苷酸重复:(AC)n、(TG)n新一代遗传标记,人类基因组研究,肿瘤,遗传病,(二)中度重复序列,1中度重复序列的特点 重复单位较大,重复次数:1O 1O5 散在分布于基因组中 常与单拷贝基因间隔排列 一般具有种属特异性,可作DNA标记,(二)中度重复序列,2中度重复序列的分类 long interspersed repeated segments,LINES,长分散片段 长度1000bp(可达7Kb),拷贝数104-105,如人Kpn I Short interspersed repeated segments,SINES,短分散片段 长度500bp,拷贝数可达105如人Alu序列,A1u序列,重复单位长300bp:130bp+31bp+130bp含有Alu酶切位点:AG CT具有种属特异性可能与hnRNA的加工成熟、DNA复制与转录调控有关,rRNA 基因,l00copyrRNA基因簇(重复单元18S-5.8S-28S RNA),四、基因家族(gene family),一组功能相似、核苷酸序列具有同源性的基因可能由某一共同祖先基因经重复和突变产生。,基因家族的特点:,基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因,如组蛋白的基因;有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;与具正常功能的基因序列相似,但无转录功能或转录产物无功能的基因称为假基因(Pseudogene)a1表示与a1相似的假基因,组蛋白基因家族,5个成员:H1,H2A,H2B,H3,H4,5个基因串联排列形成一个重复单位,但不同生物中排列不同,线粒体DNA的结构,人线粒体DNA模式图,线粒体基因组的特点,1.人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA)2.线粒体DNA为母系遗传,线粒体基因组的特点,3.结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生4.mtDNA突变频率更高5.线粒体DNA突变的表型表达与核DNA不同。,真核生物基因组与原核生物基因组的主要区别,(1)真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体)。细菌染色体基因组通常由一条环状双链DNA分子组成,染色体形成类核,无核膜与胞浆分开。(2)基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。(3)真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条肽链。原核生物基因转录产物为多顺反子,功能上相关的几个基因往往在一起组成操纵子结构。,真核生物基因组与原核生物基因组的主要区别,(4)真核基因组大部分基因含有内含子,因此,基因是不连续的,称为断裂基因,需要进行转录后加工;原核基因组没有内含子结构,不需进行转录后剪接加工。(5)真核基因组中不编码的区域多于编码区域。原核基因组大部分为编码序列,不编码区域仅占一小部分。(6)真核生物基因组存在重复序列,重复次数可达百万次以上基因组远远大于原核生物的基因组。(7)真核生物基因组存在基因家族和假基因。,第四章 病毒基因组 Viral genome,病毒(virus)的概念比较原始的、有生命特征的能够自我复制的严格细胞内寄生的非细胞生物是结构最简单、最微小的生命形式,病毒的四种基本结构成份,病毒基因组衣壳包膜其它内容物:酶、核酸结合蛋白及金属离子等。,病毒基因组的一般特征,一、病毒基因组的组成和分类,双链RNA单链RNA:正链:序列与mRNA相同 负链:序列与mRNA互补,DNA,RNA,双链DNA:HBV,单链DNA:M13噬菌体,病毒基因组核酸的类型,一个核酸分子;数个核酸分子(分段基因组),线状和环状分子,SARS冠状病毒的基因组结构,线状单链(+)RNA,病毒分类:根据基因组组成及复制方式,DNA病毒(DNA Viruses)第一组:双链DNA病毒(dsDNA Viruses)第二组:单链DNA病毒(ssDNA Viruses)RNA病毒(RNA virus)第三组:双链RNA病毒(dsRNA Viruses)第四组:正链RNA病毒((+)ssRNA Viruses)第五组:负链RNA病毒((-)ssRNA Viruses),DNA与RNA逆转录病毒(DNA and RNA Reverse Transcribing Viruses)第六组:RNA逆转录病毒(RNA Reverse Transcribing Viruses)第七组:DNA逆转录病毒(DNA Reverse Transcribing Viruses)亚病毒因子(Subviral Agents)卫星(Satellites)类病毒(Viroids)朊病毒(Prions),二、病毒基因组的大小,基因组大小:1.5103 3.6106 bp(nt)编码基因:5 数百个最大基因组:痘苗病毒科,dsDNA病毒,3.6106 bp,编码数百个蛋白质;乙型肝炎病毒:仅3.2 Kb,编码6个蛋白质,HBV基因组的不完全双链环状结构 是已知可感染人类又能独立进行复制的双链DNA病毒中最小和最高效的。,(一)帽子和poly(A)尾结构,与真核mRNA 5帽和3poly(A)尾相似作用:对RNA有保护作用 参与蛋白质的翻译过程与病毒的感染性有关 常见于:大多数真核病毒的正链RNA基因组 双链RNA基因组的正链RNA 病毒mRNA,三、病毒基因组的结构特点,图4-1 带粘性末端的病毒双链DNA基因组形成环状结构或二聚体,环化,聚合,(二)末端序列结构,(二)末端序列结构,1.粘性末端指病毒基因组双链DNA分子两端具有能够互补的单链DNA部分。作用:形成环状结构或连接成二联体或多联体。,2.末端正向重复序列,又称末端冗余(terminal redundancy);是指双链DNA分子两端有一段相同的核苷酸序列;疱疹病毒、T4及T7噬菌体基因组;经外切核酸酶切割产生粘性末端,也可使病毒基因组环化或形成多联体。,图 4-2 含末端反向重复序列的病毒基因组形成的锅柄样环状结构,+,3.末端反向重复序列(inverted terminal repeat,ITR),是指病毒基因组两端的反向互补重复序列。单链DNA或RNA分子能够通过其ITR互补配对形成锅柄样(panhandle)环状结构。腺病毒、痘病毒、细小病毒及布尼亚病毒等的基因组均含ITR序列。ITR可能与病毒的复制、转录及整合有关。,4.长末端重复序列(long terminal repeat,LTR),包括重复序列、单一序列5端:包含许多特定的基因表达调控区域,是一组真核生物增强子和启动子。3端:具有转录终止的作用。逆转录病毒基因组利用LTR中的重复序列形成环状结构,在整合酶作用下整合入宿主细胞基因组。,HIV-1病毒的基因组结构,双拷贝的单链(+)RNA:两条单链RNA通过5端的氢键结合在一起,每条RNA的长度为9749 bp;帽子和poly(A)尾,两端各有一个LTR;结构基因:gag、pol及env;多种附加基因和调节基因:vif、vpr、nef、tat及rev等;,病毒基因组,重叠基因,ORF1,ORF2,ORF3,ORF4,重叠基因,图 4-3 病毒基因组的重叠基因,(三)高效基因组,1.重叠基因(overlapping gene):病毒基因组的一段DNA序列有两个或两个以上的开放读码框架,可以编码两种或两种以上的多肽链,称为重叠基因。病毒的重叠基因符合遗传节约的原则,使病毒利用有限的基因组序列编码较多的蛋白质。2.很少间隔区:病毒基因组的非编码序列及基因间隔区很少少数真核生物病毒如腺病毒、细小病毒及逆转录病毒的基因组也存在内含子结构,因此这些病毒的mRNA也涉及转录后加工过程。,(四)分段基因组(segmented genome),是指病毒基因组由数条不同的核酸分子组成。多见于RNA病毒分段基因组有的包装在同一病毒颗粒中,有的包装在不同的病毒颗粒中,后者见于植物病毒有分段基因组的病毒一般感染效率较低,只有全部基因组核酸片段存在时,病毒才具有感染能力。由于分段基因组易发生重组,故病毒容易变异。,流感病毒的基因组结构特征,分节段单链(-)RNA甲型、乙型:8个片段丙型:7个片段组成。血凝素(HA,H1H15);神经酰胺酶(NA,N1N9)(-)RNA:转录合成mRNA的模板;合成正链RNA的模板每个节段RNA编码12个蛋白 甲型:8个片段共编码10种蛋白,病毒基因组的特点,1基因组大小相差很大:,HBV:3.2 kb痘病毒:300 kb,2核酸结构多样性:,DNA 或 RNA单链或双链 环状分子或线性分子,3基因组有连续的,有不连续的,大多数连续分段基因组:流感病毒含8条单链RNA,