第11章基因与染色体结构.ppt
第11章:基因与染色体结构,Chromosome structure,第一节、基因的概念,概念:原核、真核生物及病毒DNA或RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位能产生一个特定蛋白质的DNA序列主要位于染色体上,1.基因与DNA分子,基因是DNA分子上的功能单位基因是遗传的功能单位、交换单位、突变单位顺反子是一段核苷酸序列,能编码一条完整的多肽链顺反子的最小交换单位(交换子)和最小突变单位(突变子)都应是DNA分子中的一个核苷酸对基因存在DNA共性,2基因与多肽链,基因的主要编码产物为多肽链基因的碱基序列与蛋白质分子中氨基酸序列间的对应关系是通过遗传密码实现的,3、基因的命名,目前还没有严格的统一常用的命名方法三个小写英文斜体字母eg:cry(正体即为相应的蛋白产物)不同对象命名存在差异(果蝇、线虫、人类基因、脊椎动物等),第二节 原核生物的染色体结构 Prokaryotic Chromsome Stucture,The length of nucleic acid is much greater than the dimensions of the surrounding compartment,DNA必须处于极度压缩状态(DNA双螺旋更紧密的形式)。,(拟核),(鞭毛),细胞结构简单:无核膜-拟核(nuleoid);染色体外遗传因子:质粒(plasmid),1、原核生物基因组的结构特点,基因组很小,DNA含量低;DNA不和蛋白质固定地结合,一般不具有核小体结构;结构简单,重复序列少;存在转录单元-操纵子(启动子+操纵基因+结构基因);存在重叠基因,操纵子(operon):是原核生物调控基因表达的功能单位,功能上相关的基因集中于基因组的一个区段,一般包括启动子、操纵基因、结构基因。重叠基因(overlapping gene):指同一段DNA的编码序列,由于阅读框架的不同或终止早晚的不同,同时编码两个以上基因的现象。,发现:1977年,Sanger在Nature上发表了X174 DNA的全部核苷酸序列,正式发现了重叠基因。实验材料:X174 是单链DNA病毒,寄主为E.coli。感染寄主后将合成子代DNA分子及11个蛋白质(6078个核苷酸)。但病毒DNA本身只有5375个核苷酸。,结论:基因重叠 一个基因完全在另一个基因里面;部分重叠(最常见);两个基因只有1bp的重叠。,Overlapping genes inX174 mRNA,X174 mRNA内基因的部分重叠序列,5GAAGGAGUGAUGUAAUGUCUAAAGGU3 mRNA的一段5GAAGGAGUGAUGUAA3 基因D mRNA的3序列 Glu Gly Val Met Stop 5AUGUCUAAA3 基因J mRNA的3序列 Met Ser Lys5GAAGGAGUGA3 基因E mRNA的3序列 Lys Gly Stop,重叠基因的生物学意义,原核生物进化的经济原则;丰富和发展了基因的概念。,2、大肠杆菌(E.coli)的染色体结构,拟核:对数生长期24个,其余阶段1个;DNA占80%,其余为RNA和蛋白(稳定类核);4.2106bp 约30004000个基因 基因组由50100个长度约50100kb的相独立结构域组成,结构域与膜蛋白复合体结合而被固定;具有调控单位,如Trp操纵子和His操纵子等;操纵子的转录方向不同。在已知的50个操纵子中,27 顺时针转录,23 逆时针转录。,Domain/Loop,Basic protein,Supercoiled DNA,Member binding proteins?,Supercoiled domain,Non-supercoiled domain,Protein-membrane core or scaffold,细胞结构比较复杂,有细胞核结构;有细胞器(线粒体、叶绿体),代谢分区明确;,第三节 真核生物的染色体结构Eukaryotic Chromosome Structure,典型真核细胞示意图,基因组大大超过原核生物;DNA与蛋白质紧密结合形成复杂结构染色质存在大量不编码蛋白质的序列;存在很多重复序列;蛋白质编码基因往往以单拷贝存在。,1、真核生物基因组的结构特点,2.1、蛋白质2.2、DNA,2 真核细胞染色体的组成,2.1 蛋白质 2.1.1、组蛋白(1)种类:H1、H2A、H2B、H3、H4(2)特性:极端保守性:特别是H3和H4;无组织特异性;Aa分布的不对称性:碱性Aa集中分布在N端,疏水Aa多分布在C端;修饰作用的不均一性:H3和H4较普遍;,H5,富含Lys(24%)、Ala(16%)、Ser(13%)、Arg(11%);具有种属特异性(鸟类、两栖类、鱼类红细胞);与H1并无明显的血缘关系;功能:其磷酸化可能对染色质失活过程起着重要作用,2.1.2、非组蛋白,(1)特性:多样性、组织专一性、种属专一性;(2)常见的非组蛋白HMG蛋白(high mobility group protein)能与DNA结合,也能与H1作用,但结合得不牢固。可能与超螺旋结构有关。DNA结合蛋白 约占非组蛋白的20%,分子量较低,与DNA紧密结合。可能与DNA的复制或转录相关。,2.2.1、C值矛盾(C-value paradox),2.2 DNA,最大C值(C value):The total amount of DNA in the haploid genome 单倍体基因组总DNA 的含量。最小c值(c value):编码基因信息的总DNA含量。,The minimum genome size found in each phylum increases from prokaryotes to mammals.,There are wide variations in the genome sizes of organisms within many phyla,such as insects,amphibians and flowering plants.,C值矛盾:指基因组大小(C值)同遗传复杂度间缺少共线性。the lack of a correlation between genome size(C-value)and genetic complexity,C值矛盾的表现生物体进化程度高低与大C值无明显相关(非线性);亲缘关系相近的生物大C值相差较大。高等真核生物具有比用于遗传多的C值。?,2.2.2真核生物大C值小C值?,2.2.2.1 断裂基因2.2.2.2 重复序列,2.2.2.1 断裂基因(splitting gene)编码多肽链的DNA序列中有许多与编码无关的DNA序列-间隔基因、断裂基因,1977年美国Sharp&Berget发现splitting gene(1993),断裂基因的发现与证实:,法国的科学家Chambon 鸡的输卵管分泌卵清蛋白、卵粘蛋白和伴清蛋白,而其红细胞只合成血红蛋白,那么两种组织之间DNA有什么不同呢?DNA酶切片段与cDNA探针杂交:鸡卵清蛋白的基因组DNA用EcoRI或HindIII酶切,可分别获得或个酶切片段,每个片段都可与卵清蛋白的cDNA杂交。而卵清蛋白的cDNA却不能被EcoRI和HindIII酶切。?,1977年美国的Sharp&Berget和Roberts两组科学家分别同时发现腺病毒外壳蛋白六聚体基因(Hexon gene)前导区有断裂.腺病毒外壳蛋白的基因组DNA与其cDNA杂交可以形成R环结构。?,鸡卵清蛋白cDNA与基因组DNA的杂交图,mRNA和DNA之间形成特殊的RNA-DNA异源双链分子结构,内含子(intron):原初转录物中通过RNA剪接反应而被去除的RNA序列或基因中与这种RNA序列相对于的DNA序列。外显子(extron):原初转录物中通过RNA剪接反应而保留于成熟RNA中的序列或基因中与成熟RNA相对于的DNA序列。RNA剪接(RNA splitting):从断裂基因原初转录物中精确的切去内含子,并将外显子连接成完整成熟mRNA的过程。,怎样确定一个真核基因为断裂基因?,对基因组DNA和cDNA进行电泳;对基因组DNA和cDNA进行限制性内切酶分析对基因组DNA和cDNA测序;。,注意:Splitting gene 概念的相对性,c)并非真核生物所有的结构基因均为splitting gene,b)Extron 并非绝对“表里如一”,a)Intron 并非绝对“含而不露”,Intron II of cyt.b gene(Yeast)coding a maturase,几乎全部蛋白质基因的首尾两个外显子都只有部份序列编码氨基酸,也有完全不编码的情况,如人类尿激酶原基因 Extron I 不编码 氨基酸序列,在rRNA和tRNA 中的外显子显然是不编码氨基酸的,Splitting gene 存在的生物学意义:,A)有利于遗传的相对稳定,mutation frequency,in intron in extron(剪除)(密码),B)利用内含子进行调节,intron II of Cyt.b Long gene in yeast,C)增加变异机率,有利于生物的进化,splitting gene(含有intron),增加了基因的长度,增加了基因内的重组交换率,有利于变异和生物多样性形成,对 intron 的选择性剪接(alternative splicing),将形成不同的基因产物,D)扩大生物体的遗传信息储量,通过改变读码框架,利用 intron 编码基因,Eukaryotic genomes contain both nonrepetitive and repetitive DNA sequences,2.2.2.2、重复序列,单拷贝序列(single copy sequence)A、多为结构基因;B、是复性最慢的组分,40%80%;C、大小:7502000bp,DNA复性动力学研究,重复序列轻度重复序列中度重复序列高度重复序列,轻度重复序列,A.copies:210B.including:酵母tRNA基因、人和小鼠的珠蛋白基因,中度重复序列,A、大小:0.11kbB、重复次数:10104C、占总DNA的10%40%D、串联基因簇(tandem gene cluster)如:rDNA、Histone gene cluster、分散重复序列(dispersed repetative DNA):短散在分布元件如Alu family和长散在分布元件如KpnI family,rDNA gene family,基因家族(gene family):真核生物基因组中来源相同,结构相似,功能相关的一组基因,Histone gene family,基因簇(gene cluster):基因家族中各成员紧密排列成大断的串联重复单位,定位于染色体上相对集中的区域。,短散在分布元件(SINEs,Short Interspersed nuclear Elements)平均长度为300bp,500bp,拷贝数可达10万,与平均长度为1000bp的单拷贝顺序间隔排列如Alu家族,Hinf家族。,ALU序列重复:人类和哺乳动物中散布于整个基因组中的含有AluI 限制性内切酶切点的中度重复序列。,真核生物的 Alu family,300,000 copies 广泛分布于非重复序列间,ALU序列重复:人类和哺乳动物中散布于整个基因组中的含有AluI 限制性内切酶切点的中度重复序列。,长散在分布元件(LINEs,Long Interspersed Nuclear Elements):长度1000bp(3500-5000bp),较不均一,拷贝数较少,与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列,如 Kpn家族。,高度重复序列,A、非编码基因,只在真核生物中发现,占基因组的10%60%;B、2100bp,几千几百万拷贝串联;C、一般出现在着丝粒附近的异染色质;D、不转录,可能与染色体的稳定性有关;E、卫星DNA(microsatellite DNA):在CsCl密度梯度离心中,某些高度重复序列由于碱基组成与染色体DNA不同而带来的浮力密度的差异,在主带附近出现卫星区带。,104 bp fragment,CsCl gradient centrifugation,Eukaryote,卫星DNA的形成取决于其G-C含量及重复程度。,直接重复,镜像重复,反转重复,重复序列,DR direct repeats(直接重复):由同一方向完全相同的两个序列组成。,镜像重复序列(mirror repeat):由反方向完全相同的两个序列组成。,When S.S.DNA contains two sequences that are complementary,and form a hairpin or stem-loop structure In D.S.DNA such structure consist of two copies of an identical sequence present in the inverted orientation,IR Inverted repeats(反转重复):由反方向互补的两个DNA片段组成,IR Inverted repeats,ATCGNNNNNNNNCGAT,ATCGNNNNNCGATTAGCNNNNNGCTA,染色体的基本单位;DNA:组蛋白1:1;组蛋白H2A、H2B、H3、H4各两分子构成组蛋白八聚体,DNA双螺旋分子缠绕其上1.75圈(146bp)-核心颗粒。核心颗粒之间由DNA和组蛋白H1连接,3、核小体nucleosome,4.1、染色体与染色质是真核基因组在细胞不同阶段的存在形式;染色质是由核小体串联形成的微丝,再进一步折叠、压缩而成的。在细胞生活周期的大部分时间,都是染色质形式。只有在细胞进行有丝分裂或减数分裂,染色质高度浓缩时,才出现染色体;,4、染色体chromosome与染色质chromatin,DNA到染色体的压缩过程:,2nm DNA+组蛋白 10nm核小体链(200bp/核小体)30nm纤维(染色质丝,6个核小体/圈)150nm突环(75000bp)300nm玫瑰花结(6个突环)700nm螺线圈(30个玫瑰花结)1400nm染色体(10个螺旋圈/染色单体),人细胞含3.3109bp,其理论长度为180cm,这么长的DNA被包含在46个5.1m长的染色体中,其压缩比约为104。,4.2、常染色质与异染色质,常染色质:压缩程度较小(DNA折叠10002000倍)细胞染色时着色较浅 有转录活性的DNA序列位于常染色质中 异染色质:压缩程度较大(DNA折叠约10,000倍)细胞染色时着色较深,中心法则,蛋白质,DNA,RNA,第四节、遗传信息的流向,DNA是遗传信息的载体,通过自我复制把遗传信息从亲代传递到子代。在后代的个体发育中,遗传信息从DNA转录到RNA分子上,然后翻译成特定的蛋白质。通过蛋白质执行生物功能,表现出亲代相似的遗传特征。在RNA病毒中,RNA是遗传信息的携带者,RNA可以复制,并同时做为mRNA起作用,指导病毒蛋白质的合成。RNA分子还可以通过反转录(或逆转录)将遗传信息传递给DNA分子,这就是所谓的中心法则。,学习要点,掌握真核与原核基因组结构的区别;掌握重要概念:重叠基因、断裂基因、外显子、内含子、最大C值、最小c值、卫星序列、;掌握核小体组成、结构,熟悉组蛋白的特性。熟悉非组蛋白的种类、特性掌握中心法则的内容,