分子遗传学基因组及基因组学.ppt
《分子遗传学基因组及基因组学.ppt》由会员分享,可在线阅读,更多相关《分子遗传学基因组及基因组学.ppt(67页珍藏版)》请在三一办公上搜索。
1、第二章 基因和基因组,2.病毒基因组2.1 病毒基因组的结构多样性(1)双链DNA病毒基因组(2)单链DNA病毒基因组(3)正链RNA病毒基因组(4)负链RNA病毒基因组(5)双链RNA病毒基因组(6)反转录病毒基因组,2.2 反转录病毒基因组的结构与功能,2.3重叠基因与病毒基因组中特征序列的结构和功能,重叠基因 黏性末端末端丰余 循环排列 回文序列 末端反向重复序列 分段基因组 帽子和poly(A)结构,2.3 原核生物基因组2.3.1 大肠杆菌基因组,Escherichia coli 基因组大小为4.7106bp双链环状DNA分子,拟核结构;具有操纵子结构,K-12 MG1655有258
2、4个操纵子,其中推定的2192个操纵子中,73仅有1个基因,16.6%有2个,4.6有3个,6有4个或更多个基因。在2405个已知启动子的操纵子中,68只有1个启动子,20有2个,12有3个或更多个启动子;,6.数个操纵子还可以由一个共同的调节基因(regulatory gene)即调节子(regulon)所调控;7.除了编码rRNA的rrn基因是多拷贝,一般情况下结构基因都是单拷贝;8.不编码的基因组DNA部份所占比例比真核细胞基因组少得多;9.在基因组中编码顺序一般不会重叠.,接合 是通过细菌细胞直接的接触,遗传信息从给体单向转移到受体从而实现遗传重组的过程。接合能传递大段的DNA,在细菌
3、的遗传重组中是效率最高的。,转化 也称遗传转化(genetic transformation)是指同源或异源的游离DNA分子(质粒和染色体DNA)被自然或人工感受态细胞摄取,并得到表达的基因转移过程,转导 是通过噬菌体感染将DNA或RNA转入宿主细菌细胞并产生新性状的过程。普遍性转导(generalized transduction)普遍性转导是通过噬菌体将给体菌的任何一种遗传标记转入受体菌的过程。噬菌体细菌时,细菌染色体断裂成许多小片段。在噬菌体DNA装入外壳蛋白组成新的噬菌体时,大约在105107次装配中有一次装配错误。误将宿主细胞残留的DNA片段装入噬菌体的外壳蛋白中,成为一个转导性的噬
4、菌体。该转导性噬菌体吸附到受体细菌上,并注入其内含物,通过同源重组形成转导子。,局限性转导(specialized transduction)噬菌体只是转导供体菌某些基因的转导过程。噬菌体只能转导 E.coliK12 染色体 DNA 上的半乳糖基因(gal)和生物素基因(bio)。这是因为该噬菌体仅能整合在供体菌染色体 DNA 的特定位置(半乳糖基因 与生物素基因)上。在解离过程中偶然发生错误 就会形成携带gal或bio基因的缺陷 噬菌体,在感染受体菌后就能高效转移这两种基因。,断裂基因(split gene)即不连续基因(interrupted gene)一个基因被不编码蛋白质的DNA片段分
5、割成不连续的几部分,叫做断裂基因(interrupte gene)。Gilbert将在前体RNA拼接产生mRNA过程中丢失的片段称为内含子(intron),而将拼接后表达的片段称为外显子(exon)。研究真核生物mRNA的内含子后发现,其两侧边界均有一对保守顺序,即5-端为GU,3-端为AG,这类称为GU-AG的内含子均以相同方式剪切。,在不同的真核生物中,内含子的一致顺序有不少变化。动物中典型的剪接位置一致顺序组成为:5-AGGUAAGU-YNYURAY-Y10-20-YAG-3 其中Y为U或C,N为任何核苷酸,箭头所指为外显子与内含子的交界。5端剪接位点称供体位点(donor site,5
6、site,left splicing site),3端剪接位点称受体位点(acceptor site,3site,right splicing site)。内含子中还有另一段识别剪接边界必不可少的序列称为分枝点(branch site),位于3-端剪接位的上游,具有特征性序列组成:-YNCURAY-,紧接在分枝点的下游有一段多嘧啶序列,也是参与剪接事件蛋白接合的位置。,2.4 真核生物基因组真核生物基因组大小与C值悖理和N值悖理 基因组是指一个细胞或病毒所包含的全部基因。通常在真核生物中指一个物种的单倍体染色体组所含有的一整套基因。生物体的单倍体基因组所含DNA的总量称为C值(单位为:DNA
7、pg或bp或Kb或Mb/某个单倍体基因组)。基因组的大小大致上与进化的复杂性有关。生物基因组的大小同生物在进化上所处地位的高低及复杂性之间无严格的对应关系,这种现象通常称为C值悖理(C-value paradox)。物种的基因数目与生物进化程度或生物复杂性的不对应性,这被称之为N(number of genes)值悖理(N value paradox)或G(number of genes)值悖理。,真核生物DNA的复性动力学单链DNA所占百分数C/Co 是DNA浓度Co同反应时间t乘积的函数,通常用Cot来表示当复性反应完成一半时(C/Co1/2,t=1/2),这时的Cot值定义为Cot1/2
8、,CoT1/2值的特性 当条件一定时,CoT1/2值的大小与DNA的分子量及复杂性有关。DNA分子的复杂性是指最长的没有重复序列的核苷酸对的数目。CoT1/2值越大,表示复性速度越慢,DNA的分子量越大,在不存在重复序列的情况下,值与基因组的大小成正比,在有重复顺序的复性中,在同一个复性曲线上的各动力学组分的并不因基因组的大小而增减,而是与DNA序列的重复频率成反比。复性动力学提供真核基因组序列信息原核生物基因组DNA多为单一序列,真核生物基因组DNA有重复序列。原核生物基因组的曲线通常只有一个拐点,曲线是单一的S形曲线;而真核生物基因组DNA曲线通常有几个拐点,真核生物基因组的曲线是多S形曲
9、线,由若干个(一般23个)S形加合成的曲线。,单一序列(unique sequence)又称“单拷贝序列(single-copy sequence)”,“非重复序列(nonrepetitive sequence)”。在基因组中只含有一个拷贝的序列叫单一序列。轻度重复序列(slightly repetitive sequence)一般在一个基因组内有210份拷贝,但有时23份拷贝的DNA序列也被视作非重复序列。中度重复序列(moderately repetitive sequence)一般指10份到几百份拷贝的DNA序列。高度重复序列(highly repetitive sequence)重复次
10、数极高,一个基因组中有几百份甚至几百万份拷贝的高度重复序列。,重复序列家族 基因组内一些高度相似的重复序列构成重复序列家族(repetitive sequence family),这些重复序列包括基因和基因外的序列。真核生物基因组中来源相同、结构相似、功能相关的一组基因称为一个基因家族(gene family)。串联重复序列家族串联重复序列是指不同数目的核苷酸(简单序列)的重复拷贝串联在一起的高度重复序列,一般重复单元为2200bp,主要为卫星DNA(satellite DNA),按重复单位可将卫星DNA分为两类:小卫星DNA(minisatellite DNA)一般由长550个核苷酸的重复单
11、元组成。根据其在染色体上所处的位置和重复单元的长度,有两种形式的小卫星DNA,一种是端粒DNA,另一种位于亚端粒区,称为可变数目串联重复(varible number tandem repeat,VNTR),是由短重复单元(640bp)串联重复(6100次以上)而成的DNA序列。微卫星DNA(microsatellite DNA)。也称为短串联重复(short tandem repeat,STR)是由26个核苷酸组成的重复单元串联重复(1060次)而成的简单重复序列,如和等,三核苷酸和四核苷酸重复相对较少。,散在重复序列家族是分布于基因组内散在的重复序列,一般为中等重复序列。根据其重复序列的长
12、短,可分为短散在重复序列(short interspersed repeated sequence)又称为短散在核元件(short interspersed nuclear elements,SINEs)和长散在重复序列(long interspersed repeated sequence)又称为长散在核元件(long interspersed nuclear elements,LINEs)。SINE长约500bp,拷贝数在10万以上,例如人的Alu序列。LINEs长约67kb,在哺乳动物基因组中有2万5万个拷贝,它们组成L1家族,主要含有反转录转座子。,基因家族 由同一个祖先基因经过重复与
13、变异、进化而形成结构与功能相似的一组基因组成一个基因家族(gene family)。基因家族中的各个成员可以聚集成簇也可以分散在不同染色体上。根据结构和功能以及在发育过程中的表达情况,基因家族可以分为:简单的多基因家族(simple multigene families),复杂的多基因家族(complex multigene families)发育控制的复杂多基因家族(developmentaly controlled complex multigene families),简单的多基因家族 由结构相同的一个或数个基因以串联方式重复排列的形式存在于染色体上。真核生物核糖体(rRNA)基因簇是典
14、型的简单的多基因家族,有18S、5.8S、28S和5S 等4种rRNA基因,前3种主体rRNA,与后一种5S rRNA基因分开位于不同的染色体或相同染色体的不同位置。主体rRNA基因按18S-5.8S-28S顺序包含在约7800bp185000bp的一个rDNA重复单元中,其前体为45S rRNA,此前体经加工形成成熟的rRNA。重复次数在5010000左右。5S rRNA基因家族中各个5S rRNA基因之间为26倍长的间隔序列所隔开,例如果蝇的5S rRNA基因有165个拷贝,重复单元为375bp,其中编码区长度恒定为120bp,间隔区为2505bp。,复杂的多基因家族 各个成员并不都相同,
15、数个功能相关的基因串联成簇由间隔序列分开,分别转录出各自的mRNA。组蛋白基因属于这一类型。在海胆和果蝇中,编码H1、H2A、H2B、H3和H4这5种组蛋白的基因彼此靠拢,串联在一起,构成一个重复单元.每个重复单元长约6000bp左右,在海胆中重复300600次,在果蝇中重复100次左右。每个重复单元中的组蛋白基因,被转录间隔区序列隔开,它们可以以相同的方向转录如海胆组蛋白基因,也可以按不同反向转录如果蝇组蛋白基因,但共同特点之一是这些组蛋白基因内都无内含子。哺乳动物组蛋白基因的排列没有任何规律的极性或重复一致性,但它们都是一类中度重复序列,是重复序列中唯一在正常情况下能够翻译出蛋白质的基因。
16、,发育控制的复杂多基因家族 功能相关的基因分别串联成簇,在生物个体发育过程中按一定的顺序表达或关闭,这些基因家族成员随着发育阶段的变化而先后出现.例如人类血红蛋白就属于这类基因家族所编码,该基因家族中的不同成员在胚胎不同时期、儿童和成人组织中表达。基因家族中的一些成员聚集在DNA的一 个区域内,而另一些成员分散在不同的染色体上。人类-珠蛋白基因和-珠蛋白基因分别位于第16号染色体和第11号染色体上,每个基因家族都包括有功能的基因和假基因。有功能的基因分别在不同的发育时期表达.,假基因 核苷酸序列与相应正常功能基因基本相同,但没有编码蛋白质能力的基因或不产生有功能产物的基因称为假基因(Pseud
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分子 遗传学 基因组
链接地址:https://www.31ppt.com/p-4958282.html