分子生物学第二章DNA结构与功能.ppt
2 DNA结构与功能,主 要 内 容,染色体 DNA的结构 DNA的复制 DNA的修复 DNA的转座,2023/9/23,一、染色体(Chromosome),内容提要:细胞周期染色体与染色质染色体的结构和组成(原核生物、真核生物)核小体原核生物和真核生物基因组结构特点比较,(一)细胞周期,(二)染色体与染色质,染色体(chromosome)是细胞在有丝分裂时遗传物质存在的特定形式,是间期细胞染色质结构紧密包装的结果。真核生物的染色体在细胞生活周期的大部分时间里都是以染色质(chromatin)的形式存在的。染色质是一种纤维状结构,叫做染色质丝,它是由最基本的单位核小体(nucleosome)成串排列而成的。,(三)染色体的结构和组成,原核生物(prokaryote),真核生物染色体的组成,核小体组蛋白(nucleosomal histone):H2B、H2A、H3和H4,帮助DNA卷曲形成核小体的稳定结构H1组蛋白:在构成核小体时H1起连接作用,它赋予染色质以极性。,1、组蛋白(histone),真核生物染色体的基本结构蛋白 富含带正电荷的Arg和Lys等碱性氨基酸 碱性蛋白质 可以和酸性的DNA紧密结合(非特异性结合);,组蛋白的一般特性:,i)进化极端保守性:不同种生物组蛋白的氨基酸组成十分相似。其中H3、H4最保守;H2A、H2B变化相对大;H1变化更大。H3、H4可能对稳定真核生物的染色体结构起重要作用。保守程度:H1 H2A、H2B H3、H4,上海生化所分子遗传学1998年试题:在真核生物核内,五种组蛋白(H1 H2A H2B H3 和H4)在进化过程中,H4极为保守,H2A最不保守(),ii)无种属组织特异性:,到目前为止,仅发现鸟类、鱼类及两栖类红细胞染色体不含H1而带有H5;精细胞染色体的组蛋白是鱼精蛋白。,iii)肽链氨基酸分布的不对称性,碱性氨基酸集中分布在N端的半条链上,大部分疏水基团分布在C端;可能与它们的功能相互作用有关:碱性的半条链易与DNA的负电荷区结合,而另外半条链与其它组蛋白、非组蛋白结合。,iv)H5组蛋白的特殊性:,富含赖氨酸(24%)、丙氨酸(16)、丝氨酸(13)、精氨酸(11)。H5的磷酸化可能在染色质失活过程中起重要作用。,在细胞周期特定时间可发生甲基化、乙酰化、磷酸化和ADP核糖基化等。H3、H4修饰作用较普遍,H2B有乙酰化作用、H1有磷酸化作用。H2A、H2B、H1不明显。,v)组蛋白的可修饰性,修饰作用的特点:降低组蛋白所携带的正电荷。,组蛋白修饰的意义:,一是改变染色体的结构,直接影响转录活性;二是核小体表面发生改变,使其它调控蛋白易于和染色质相互接触,从而间接影响转录活性。,简述真核生物染色体上组蛋白的种类,组蛋白修饰的种类及其生物学意义中国科学院2003年硕士研究生入学生物化学与分子生物学试题,2.非组蛋白,占组蛋白总量的6070,种类很多,20100种,常见有1520种;包括酶类、如RNA聚合酶及与细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物以及肌动蛋白、肌球蛋白、微管蛋白、原肌蛋白等。可能是染色质的结构部分。,高速泳动(high mobility group protein,HMG)蛋白:能与DNA结合,也能与H1结合,可能与DNA的超螺旋结构有关。DNA结合蛋白:能是一些与DNA的复制或转录有关的酶或调节物质。A24非组蛋白:其C端与H2A相同,但它有两个N端,一个N端的序列与H2A相同,另一个与泛素相同;其大小与H2A差不多,酸性,含较多的谷氨酸和天冬氨酸,位于核小体内,功能不祥。,非组蛋白,非组蛋白具多样性和异质性 对DNA具有识别特异性,又称序列特异性DNA结合蛋白(sequence specific DNA binding proteins)具有多种功能,包括基因表达的调控和染色质高级结构的形成。,C值:是一种生物的单倍体基因组DNA的总量。C值反常现象(C-value paradox)/C值矛盾:真核细胞基因组的最大特点是它含有大量的重复序列,而且功能DNA序列大多被不编码蛋白质的非功能DNA所隔开,这就是著名的“C值反常现象”。,3.真核生物基因组DNA,Genome:all DNA sequences in a cellGenes:a stretch of continuous DNA sequence encoding a protein or RNAC-value is the quantity of DNA in the genome(per haploid set of chromosomes).C-value paradox(C值矛盾)refers to the lack of a correlation between genome size and genetic complexity,在真核生物中C值一般是随生物进化而增加的,高等生物的C值一般大于低等生物。然而,某些两栖类的C值甚至比哺乳动物还大,而在两栖类中C值的变化也很大,可相差100倍。由此推断,许多DNA序列可能不编码蛋白质,是无生理功能的。,Range of genome size found in different organism phyla.,C值反常现象/C值矛盾:指C值与种系进化复杂性不一致的现象。,简述DNA的C值以及C值矛盾(C Value paradox).中科院上海生化所 98 年上海第二军医大:C值矛盾,(四)核小体(nucleosome),Nucleosome、chromosome、genome 中科院2002年硕士学位研究生入学分子遗传学试题,1、定义:用于包装染色质的结构单位,是由DNA链缠绕一个组蛋白核构成的。,2、核小体的结构,核心颗粒连接区DNA,Histone octamer(组蛋白八聚体),Top view,Side view,Nucleosome core,Nucleosome core146 bp,1.8 superhelical turn,Chromatosome166 bp,2 superhelical turn,DNA,Histone octamer,Histone H1,每个核小体单位包括200bp左右的DNA超螺旋和一个组蛋白八聚体及一分子H1组蛋白构成核小体的盘状核心结构 146bp的DNA分子超螺旋盘绕组蛋白八聚体1.75圈,组蛋白H1在核心颗粒外结合额外20bpDNA,锁住核小体DNA的进出端,起稳定核小体的作用。包括组蛋白H1和166bp DNA的核小体结构又称染色质小体。两个相邻核小体之间以连接DNA相连,典型长度60bp,不同物种变化值为080bp 组蛋白与DNA之间的相互作用主要是结构性的,基本不依赖于核苷酸的特异序列,实验表明,核小体具有自组装(self-assemble)的性质 核小体沿DNA的定位受不同因素的影响,进而通过核小体相位改变影响基因表达,中国科学院上海生化与细胞所2002年招收硕士研究生分子遗传学入学考试:简述真核细胞内核小体与核小体核心颗粒的结构。,3、染色体的包装超螺旋结构,染色质包装的多级螺旋模型,一级结构:核小体 二级结构:螺线管(solenoid)三级结构:超螺线管(supersolenoid)四级结构:染色单体(chromatid)压缩7倍 压缩6倍 压缩40倍 压缩5倍 DNA核小体螺线管超螺线管染色单体,6.8:1,40:1,1000:1,8000:1,DNA double helix,Nucleosome(10 nm fiber),30 nm Fiber,Loops I,Loops II,chromosome,由X-射线晶体衍射(2.8A)所揭示的核小体三维结构(引自K.Luger等,1997)a.通过DNA超螺旋中心轴所显示的核小体核心颗粒8个组蛋白分子的位置;b垂直与中心轴的角度所见到的核小体核心颗粒的盘状结构;c半个核小体核心颗粒的示意模型,一圈DNA超螺旋(73bp)和4种核心组蛋白分子,每种组蛋白由3 个螺旋和一个伸展的N-端尾部组成。N-端尾部有序排列,参与核小体之间的相互作用,以形成螺线管等高级结构。,上海第二军医大硕士研究生入学考试试题:基因组的特点(真核、原核比较),(五)原核生物和真核生物基因组 结构特点比较,1、真核生物基因组结构特点,基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。基因组DNA与蛋白质结合形成染色体,储存于细胞核内,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。单顺反子:一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。,基因不连续性 断裂基因(interrupted gene)、内含子(intron)、外显子(exon)非编码区较多 多于编码序列(9:1)含有大量重复序列:重复次数可达百万次以上真核基因组存在大量的顺式作用元件。包括启动子、增强子、沉默子等。真核基因组存在大量的DNA多态性。DNA多态性是指DNA序列中发生变异而导致的个体间核苷酸序列的差异,主要包括单核苷酸多态性(SNP)和串联重复序列多态性等。真核生物基因组具有端粒结构。,真核细胞DNA序列大致可被分为3类:,不重复序列/单一序列 中度重复序列 高度重复序列,(1)不重复序列/单一序列 在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占DNA总量的40-80,不重复序列长约750-2000bp,相当于一个结构基因的长度。真核生物的大多数基因在单倍体中都是单拷贝的。如:蛋清蛋白、血红蛋白等 功能:编码蛋白质。,在基因组中,单拷贝顺序的两侧往往为散在分布的重复顺序。由于某些单拷贝顺序编码蛋白质,体现了生物的各种功能,因此对这些序列的研究对医学实践有特别重要的意义。,(2)中度重复序列:这类序列的重复次数在101104之间,占总DNA的1040,如小鼠中占20,果蝇中占15。各种rRNA、tRNA以及某些结构基因(如组蛋白基因等)都属于这一类。一般是不编码蛋白质的序列,在调控基因表达中起重要作用,28S、5.8S及18S rRNA基因:非洲爪蛙的18S、5.8S及28S rRNA基因是连在一起的,它们中间隔着不转录的间隔区,这些18S、5.8S及28S rRNA基因及间隔区组成的单位在DNA链上串联重复许多次。不转录的间隔区是由21-100个碱基对组成的类似卫星DNA的串联重复序列。中度重复序列往往分散在不重复序列之间。,依据重复顺序的长度,中度重复顺序可分为两种类型:短分散片段 长分散片段,补充:,(i)短分散片段(short interspersed repeated segments,SINES):这类重复顺序的平均长度约为300bp(小于500bp),它们与平均长度约为1000bp的单拷贝顺序间隔排列。拷贝数可达10万左右。如Alu家族等属于这种类型的中度重复序列。,Alu家族:Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6。Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶Alu的切点(AGCT)从而将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)。,Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA、内含子中都发现有Alu序列,平均每5kb DNA就有一个Alu顺序。已建立的基因组中无例外地含有Alu顺序。Alu序列具有种的特异性,人的Alu序列制备的探针只能用于检测人的基因组中的Alu序列。由于在大多数的含有人的DNA的克隆中都含有Alu顺序,因此,可以这样认为,用人的Alu序列制备的探针与要筛选的克隆杂交,阳性者即为含有人DNA克隆,阴性者不含有人DNA。,Hinf家族:这一家族以319bp长度的串联重复存在于人体基因组中。用限制性内切酶Hinf消化人体DNA,可以分离到这一片段。Hinf家族在单位基因组内约有50-100个拷贝,分散在不同的区域。319bp单位可以再分成两个亚单位,分别为172bp和147bp,它们之间有70%的同源性。,多聚d-d家族:这一家族的基本单位是d-d双核苷酸,多个d-d双核苷酸串联重复在一起,分散于人体基因组中。这个家族的一个成员位于人类和珠蛋白基因之间,含有17个d-d双核苷酸组成的串联重复顺序。在人基因组中,d-d交替顺序达106拷贝,这些顺序的平均长度为40bp。人们推测,这样一个短的串联重复顺序可能是基因转变(gene conversion)或不等交换(unequal crossing-over)的识别信号。另外,这些嘌呤和嘧啶的交替顺序有助于Z-DNA的形成,在基因调节中可能起着重要的作用。中度重复顺序除了包括以上非编码区域外,许多编码区如rRNA基因,tRNA基因,组蛋白基因等在基因组中也多次重复,属于中度重复顺序。,(ii)长分散片段(Long interspersed repeated segments,LINES):这类重复顺序的长度大于1000bp,平均长度为3500-5000bp,它们与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列。也有的实验显示人基因组中所有LINES之间的平均距离为2.2kb,拷贝数一般在1万左右,如Kpn家族等。,Kpn家族:Kpn家族是中度重复序列中仅次于Alu家族的第二大家族。用限制性内切酶Kpn消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2、1.5、1.8和1.9kb,这就是所谓的Kpn家族。Kpn家族成员顺序比Alu家族更长(如人Kpn顺序长6.4kb),而且更加不均一,呈散在分布,属于中度重复顺序的长分散片段型。,尽管不同长度类型的Kpn家族(称为亚类)之间同源性比较小,不能互相杂交,但它们的3端有广泛的同源性。Kpn家族的拷贝数约为30004800个,占人体基因组的1,与散在分布的Alu家族相似,Kpn家族中至少有一部份也是通过Kpn顺序的RNA转录产物的cDNA拷贝的重新插入到人基因组DNA中而产生的。,(3)高度重复序列卫星DNA 这类DNA只在真核生物中发现,占基因组的1060,由6100个碱基组成,在DNA链上串联重复高达数百万次。卫星DNA:实验中常用CsCI密度梯度离心将卫星DNA与其他DNA分开,形成两个以上的峰,即含量较大的主峰和高度重复序列小峰,后者又称卫星区带(峰)。A T含量很高的简单高度重复序列,Satellite DNA,Mouse genome DNA,30%GC in satellite DNA,D4 Genome Complexity,CsCl centrifugation,5 ATAAACTATAAACTATAAACT 33 TATTTGATATTTGATATTTGA 5,Drosophila satellite DNA repeat(several million copies),n,ACAAACT,1.1x107 bp,25%genomeATAAACT,3.6x106 bp,8%genomeACAAATT,3.6x106 bp,8%genomeAATATAG,crypticSatellites comprise more than 40%of the genome,(i)倒位(反向)重复序列 重复顺序复性速度极快 分布较广 约占人基因组的5。,(ii)卫星DNA卫星DNA(satellite DNA)是另一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成串排列。由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。在人细胞组中卫星DNA约占5-6。,(iii)较复杂的重复单位组成的重复顺序这种重复顺序为灵长类所独有。用限制性内切酶Hind消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。有人把这类称为卫星DNA。而人的卫星DNA更为复杂,含有多顺序家族。,(iv)高度重复顺序的功能a.参与复制水平的调节 反向序列常存在于DNA复制起点区的附近。另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。b.参与基因表达的调控 DNA的重复顺序可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用.c.参与转位作用 几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。,d.与进化有关 不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。如人的卫星DNA长度仅差1个碱基(前者为171bp,后者为172bp),而且碱基序列有65是相同的,这表明它们来自共同的祖先。在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹.f.卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。,根据 DNA复性动力学研究,DNA序列可以分成哪几种类型?并加以举例说明。(2001年上海生化所),多基因家族与假基因真核基因组的另一特点就是存在多基因家族(multi-gene family)。多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。,多基因家族大致可分为两类:一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。,在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。,与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。人们推测,假基因的来源之一可能是基因经过转录后生成的RNA前体通过剪接失去内含子形成mRNA,如果mRNA经反复转录产生cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。,自私DNA(selfish DNA)在哺乳动物包括人体基因组中,存在着大量的非编码顺序,如高度重复顺序,内含子,间隔DNA等。这些顺序中,只有很小一部份具有重要的调节功能,绝大部分都没有什么特殊功用。在这些DNA序列中虽然积累了大量缺失,重复或其他突变,但对生物并没有什么影响,它们的功能似乎只是自身复制,所以人们称这类DNA为自私DNA或寄生DNA(parasite DNA)。自私DNA也许有重要的功能。,高变区DNA与DNA指纹人的卫星DNA或称随体DNA是由一些短的DNA片段(10bp 左右)多次重复所构成的。重复片段的组成和拷贝数在不同的个体及基因组的不同位置上不一样。提取不同个体的基因组DNA 后,用其切点能识别序列为4 个碱基而又不切割该重复片段的限制性内切酶在重复片段的两侧切割基因组DNA,然后将样品进行凝胶电泳。不同长度的重复片段(主要是由于重复单位的拷贝数不同所致)就会分开,再与含有这些重复序列的特异性探针杂交,便形成有个体特异性的放射性自显影图,亦称为DNA指纹。,DNA 指纹的图谱取决于所用探针的核心序列(即重复序列中的重复单位)。目前所用的探针有两种,即 探针33.5:其核心序列为AGAGGTGGGCAGGTGG 探针33.6:即AGGGCTGGAGG。这两种序列在人体基因组中不同的位置上分别重复不同的次数,而在不同个体的基因组中,对应位置上这两种核心序列的重复次数也不相同。这样用这两种探针之一与合适的酶切割的人体基因组DNA 片段杂交,在不同的个体将得到不同的DNA指纹,而且探针33.5 的DNA指纹图也不相同。,DNA 指纹具有细胞稳定性和种系稳定性,是按孟德尔规律遗传的,而且杂合性高。杂合性可以这样来理解,对于由点突变引起的RFLP,就某一个多态性切点来说只有两种多态性,即切点有(+)或切点无(-)。而对由于高变区重复片段长度不同所引起的RFLP 来说,在基因组上某一个位置核心序列的重复次数在不同的个体不一样,比如在个体为10 个拷贝,个体为15 个拷贝,而个体又可能为18 个拷贝等等。因此,在不同个体同一个相应位置上核心序列的重复次数就是多态的,而不是双态的。即使在基因组上的某一个位置处核心序列的次数一样,从而被酶切出的长度相同,但在基因组的其他位置上该核心序列重复次数又可能不同。,由于DNA 指纹是按孟德尔规律遗传的,子代的DNA指纹图可以追溯到其父母DNA指纹图上,而在不是其父母的DNA指纹图上则很难找到与其一样的小随体DNA片段。在父亲的5条可分辨的小随体DNA片段中,有4条处于杂合状态,即这4条DNA片段有不同的个体长度。因此,因高变区核心序列重复次数不同引起的RLFP才是真正的多态性。在不同个体,这种RLFP即DNA指纹可以说不存在相同的。即使使用一种探针产生的DNA指纹图无法鉴定这两个个体,如再用另一种探针便有可能将这两个个体区分开。DNA指纹技术已被应用于亲子鉴定和法医学上对罪犯的确认等领域。,2、原核生物基因组结构特点,(1)原核生物的基因组很小,大多只有一条染色体,且DNA含量少。大肠杆菌DNA的相对分子质量仅为2.4x109,或4.6x106bp,其完全伸展总长约为1.3mm,含4000多个基因。最小的病毒如双链DNA病毒SV40,其基因组相对分子质量只有3x106,含5个基因。细菌的质粒、真核生物的线粒体、高等植物的叶绿体等也含有DNA和功能基因,这些DNA被称为染色体外遗传因子。,(2)结构简练 原核DNA分子的绝大部分是用来编码蛋白质的,只有非常小的一部分不转录,而且,这些不转录DNA序列通常是控制基因表达的序列,如Xl74的H和A基因之间(39063973位核苷酸)就包括了RNA聚合酶结合位点、转录终止信号区及核糖体结合位点等基因表达调控元件。,(3)存在转录单元 多顺反子 原核生物DNA序列中功能相关的RNA和蛋白质基因,往往丛集在基因组的一个或几个特定部位,形成功能单位或转录单元,它们可被一起转录为含多个mRNA的分子,叫多顺反子mRNA。功能相关的基因。如Xl74中的D-E-J-F-G-H等都串联在一起转录产生一条mRNA链,然后再翻译成各种蛋白质,其中J、F、G及H编码外壳蛋白,D蛋白与病毒装配有关,E蛋白则导致细菌的裂解。这是功能相关基因协同表达的方式之一。,X174 D-E-J-F-G-H mRNA 蛋白J、F、G H D E,(4)重叠基因 即同一段DNA能携带两种不同蛋白质的信息。主要有以下几种情况:(1)一个基因完全在另一个基因里面,如基因B在基因A内,基因E在基因D内。(2)部分重叠,如基因K和基因C的部分重叠。(3)两个基因只有一个碱基对的重叠,如D基因终止密码子的最后一个碱基是J基因起始密码子的第一个碱基。,有重叠基因(Sanger 发现)基因内基因 部分重叠基因 一个碱基重叠,尽管这些重叠基因的DNA序列大致相同,但由于基因重叠部位一个碱基的变化可能影响后续肽链的全部序列,从而编码完全不同的蛋白质。除了X174外,SV40病毒、噬菌体的DNA中也存在基因重叠现象。基因重叠可能是生物进化过程中自然选择的结果。,二、DNA的组成与结构,(一)DNA的结构,1.DNA的一级结构:就是指4种核苷酸的连接及其排列顺序,表示了该DNA分子的化学构成。核苷酸序列对DNA高级结构的形成有很大影响,如B-DNA中多聚(G-C)区易出现左手螺旋DNA(Z-DNA),而反向重复的DNA片段易出现发卡式结构等。DNA不仅具有严格的化学组成,还具有特殊的高级结构,它主要以有规则的双螺旋形式存在,其基本特点是:,(1)DNA分子是由两条平行的脱氧核苷酸长链盘绕而成的。(2)DNA分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。(3)两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。这就是嘌呤与嘧啶配对,而且腺嘌呤(A)只能与胸腺嘧啶(T)配对,鸟嘌呤(G)只能与胞嘧啶(C)配对。,2、DNA 的二级结构,1)定义:指两条多核苷酸链反向平行盘绕所产生的双螺旋结构。,这些研究表明DNA的分子结构不是一成不变的,在不同的条件下可以有所不同。但是,这些不同构象的DNA都有共同的一点:它们都是右手双螺旋;两条反向平行的核苷酸链通过atson-Crick碱基配对结合在一起;链的重复单位是单核苷酸;这些螺旋中都有两个螺旋沟,分为大沟与小沟,只是它们的宽窄和深浅程度有所不同。,DNA结构的多态性,A,B,Z,Double helix B form:Right-handed10 base pairs/turn 34/turnDiameter:ca.20 Other forms:A:11 bases/turn,base plate 20 slantZ:12 bases/turn,left-handed helical,one groove,A-T丰富的DNA片段常呈B-DNA。若DNA双链中一条链被相应的RNA链所替换,会变构成A-DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的RNA链间形成的双链就是A-DNA。A-DNA构象对基因表达有重要意义。此外B-DNA双链都被RNA链所取代而得到由两条RNA链组成的双螺旋结构也是A-DNA。在右手螺旋中,除A-DNA、B-DNA螺旋外,还存在B-DNA、C-DNA和D-DNA等不同形式。,左手螺旋-Z-DNA Z-DNA(英文字Zigzag的第一个字母)结构是1979年由Rich提出的。Rich用一位荷兰科学家提供的d(CGCGCG)结晶,对它进行X射线衍射结构分析,最后提出了Z-DNA结构模型。当时,由于用右手螺旋结构模型解链过程来解释大分子DNA复制时遇到困难,该模型的提出曾一度动摇过右手螺旋学说,现已证明,左手螺旋Z-DNA只是右手螺旋结构模型的一个补充和发展。虽然B-DNA是最常见的DNA构象,但A-DNA和Z-DNA似乎具有不同的生物活性。,在邻近调控系统中,与调节区相邻的转录区被Z-DNA抑制,只有当Z-DNA转变为B-DNA后,转录才得以活化。而在远距离调控系统中,Z-DNA可通过改变负超螺旋水平,决定聚合酶能否与模板链相结合而调节转录起始活性。,3 DNA的高级结构,DNA的高级结构是指DNA双螺旋进一步扭曲盘绕所形成的特定空间结构。超螺旋结构是DNA高级结构的主要形式,可分为正超螺旋与负超螺旋两大类,它们在特殊情况下可以相互转变。,线状DNA形成的超螺旋,环状DNA形成的超螺旋,拓扑异构酶or溴化乙锭,拓扑异构酶or溴化乙锭,DNA扭曲与双螺旋相同(拧紧),DNA扭曲与双螺旋相反(松开),负超螺旋,松弛DNA,正超螺旋,4.核酸的变性和复性 变性(denaturation)和复性(renaturation)是双链核酸分子的二个重要物理特性。也是核酸研究中经常引用的术语。双链DNA、RNA双链区、DNA:RNA杂种双链(hybrid duplex)以及其它异源双链核酸分子(heteroduplex)都具有此性质。,(1)DNA的变性:指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。就是维持双螺旋稳定性的氢键和疏水键的断裂。断裂可以是部分的或全部的,是可逆的或是非可逆的。DNA变性不涉及到其一级结构的改变。,凡能破坏双螺旋稳定性的因素都可以成为变性的条件:加热 极端的pH 有机试剂甲醇、乙醇 尿素及甲酰胺等 均可破坏双螺旋结构引起核酸分子变性。,溶液粘度降低:DNA双螺旋是紧密的刚性结构,变性后代之以“柔软”而松散的无规则单股线性结构,DNA粘度因此而明显下降。溶液旋光性发生改变:变性后整个DNA分子的对称性及分子局部的构性改变,使DNA溶液的旋光性发生变化。,变性导致DNA理化及生物学性质的改变:,增色效应或高色效应(hyperchromic effect):指变性后DNA溶液的紫外吸收作用增强的效应。DNA分子具有吸收250280nm波长的紫外光的特性,其吸收峰值在260nm。DNA分子中碱基间电子的相互作用是紫外吸收的结构基础,但双螺旋结构有序堆积的碱基又束缚了这种作用。变性DNA的双链解开,碱基中电子的相互作用更有利于紫外吸收,故而产生增色效应。,以加热为变性条件时,增色效应与温度有十分密切的关系,这主要是变性温度取决于DNA自身的性质。热变性使DNA分子双链解开所需温度称为熔解温度(melting temperature,Tm)。Tm定义中包含了使被测DNA的50%发生变性的意义.不同来源DNA具有不同的Tm。,在溶剂相同的前提下,有下列两方面造成的:(i)DNA的均一性:DNA分子中碱基组成的均一性:如人工合成的只含有一种碱基对的多核苷酸片段,与天然DNA比较,其Tm值范围就较窄。因前者在变性时的氢链断裂几乎可“齐同”进行,故所要求的变性温度更趋于一致。其次还包含有待测样品DNA的组成是否均一:如样品中只含有一种病毒DNA,其Tm值范围较窄,若混杂有其它来源的DNA,则Tm值范围较宽。总的说,DNA均一性,变性的DNA链各部分的氢键断裂所需能量较接近,Tm值范围较窄,反之亦然。,(ii)DNA的(G+C)含量:在溶剂固定的前提下,Tm值的高低取决于DNA分子中的(G+C)的含量。(G+C)含量越高,即G-C碱基对越多,Tm值越高。因G-C碱基对具有3对氢键,而A-T碱基对只有2对氢键,DNA中(G+C)含量高显然更能增强结构的稳定性,破坏G-C间氢键需比A-T氢键付出更多的能量,故(G+C)含量高的DNA,其变性Tm也高。实验说明,Tm与DNA中(G+C)含量存在着密切相关性,变性温度还受到溶液离子强度的影响。Tm与(G+C)含量(X)百分数的这种关系可用以下经验公式表示(DNA溶于0.2mol/L NaCl中):X%(G+C)=2.44(Tm-69.3),(2)DNA的复性:指变性DNA在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象。它是变性的一种逆转过程。热变性DNA一般经缓慢冷却后即可复性,此过程称之为“退火”(annealing)。,DNA的复性受温度和DNA自身特性等影响。温度和时间:一般认为比Tm低5左右的温度是复性的最佳条件。降温时间太短以及温差大均不利于复性。DNA浓度:复性的速度与DNA浓度的平方成正比。即溶液中DNA分子越多,相互碰撞结合“成核”的机会越大。,DNA顺序的复杂性:简单顺序的DNA分子,互补碱基的配对较易实现。而顺序复杂的DNA,如小牛DNA的非重复部分,一般以单拷贝存在于基因组中,这种复杂特定序列要实现互补,显然要比上述简单序列困难得多。,Cot:Co为单链DNA的起始浓度,t是以秒为单位的时间,用以表示复性速度与DNA序列复杂性的关系。将温度、溶剂离子强度、核酸片段大小不变,以不同程度的核酸分子重缔合部分(在时间t时的复性率)取对数后对Cot作图,可以得到如图所示的曲线,用非重复碱基对数表示核酸分子的复杂性。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105,核苷对的非重复DNA的复杂性为105。原核生物基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接与基因组大小成正比,对于真核生物基因组中的非重复片段也是如此。,在标准条件下(一般为0.18mol/L阳离子浓度,400核苷酸的长的片段)测得的复性率达0.5时的Cot值(称Cot 1/2),与核苷酸对的复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复序列,所得到的Cot曲线要较图中的S曲线复杂。,(3)核酸分子杂交:分子杂交(hybridization)是核酸研究中一项最基本的实验技术。其基本原理就是应用核酸分子的变性和复性的性质,使来源不同的DNA(或RNA)片段,按碱基互补关系形成杂交双链分子(heteroduplex)。杂交双链可以在DNA与DNA链之间,也可在RNA与DNA链之间形成。杂交的本质就是在一定条件下使互补核酸链实现复性(加热或碱处理)使双螺旋解开成为单链,因此,变性技术也是核酸杂交的一个环节。,若杂交的目的是识别靶DNA中的特异核苷酸序列,探针是指带有某些标记物(如放射性同位素32P,荧光物质异硫氰酸荧光素等)的特异性核酸序列片段。若我们设法使一个核酸序列带上32P,那么它与靶序列互补形成的杂交双链,就会带有放射性。以适当方法接受来自杂交链的放射信号,即可对靶序列DNA的存在及其分子大小加以鉴别。在现代分子生物学实验中,探针的制备和使用是与分子杂交相辅相成的技术手段。核酸分子杂交作为一项基本技术,已应用于核酸结构与功能研究的各个方面。在医学上,目前已用于多种遗传性疾病的基因诊断(gene diagnosis),恶性肿瘤的基因分析,传染病病原体的检测等领域中,其成果大大促进了现代医学的进步和发展。,三 DNA的复制,生命的遗传实际上是染色体DNA自我复制的结果。而DNA的自我复制主要是通过半保留复制来实现的,是一个以亲代DNA分子为模板合成子代DNA链的过程。,1 DNA的半保留复制机理,DNA在复制过程中碱基间的氢键首先断裂,双螺旋解旋并被分开,每条链分别作为模板合成新链,产生互补的两条链。这样新形成的两个DNA分子与原来DNA分子的碱基顺序完全一样。因此,每个子代分子的一条链来自亲代DNA,另一条链则是新合成的,所以这种复制方式被称为DNA的半保留复制(Semiconservative replication)。,(一)DNA半保留复制,Semi-conservative Conservative Dispersive,2、实验证据(1958 Meselson 和Stahl):,Matthew Meselson Franklin Stahl,3、DNA半保留复制的生物学意义:,DNA的半保留复制:表明DNA在代谢上的稳定性 保证亲代的遗传信息稳定地传递给后代。,(二)与DNA复制有关的物质,1、原料:四种脱氧核苷三磷酸(dATP、dGTP、dCTP、dTTP)2、模板:以DNA的两条链为模板链,合成子代DNA3、引物:DNA的合成需要一段RNA链作为引物4、引物合成酶(引发酶):此酶以DNA为模板合成一段RNA,这段RNA作为合成DNA的引物(Primer)。实质是以DNA为模板的RNA聚合酶。,Arthur Kornberg,Discovered an enzyme in E.coli that could catalyse the synthesis of DNA He called it DNA Polymerase Now known as DNA polymerase I 1959-Nobel prize in Physiology or Medicine,5、DNA聚合酶:以DNA为模板的DNA合成酶 以四种脱氧核苷酸三磷酸为底物 反应需要有模板的指导 反应需要有3-OH存在 DNA链的合成方向为5 3,主要是对DNA损伤的修复;以及在DNA复制时切除RNA引物并填补其留下的空隙。,修复紫外光引起的DNA损伤,DNA 复制的主要聚合酶,还具有3-5 外切酶的校对功能,提高DNA复制的保真性,原核生物中的DNA聚合酶(大肠杆菌),定位 细胞核 细胞核 线粒体 细胞核 细胞核3-5外切-+酶活性功能,引物合成,修复作用,线粒体DNA的复制,核DNA的