分子遗传学基因组及基因组学.ppt

资源ID：4958282 资源大小：1.83MB 全文页数：67页
资源格式： PPT 下载积分：15金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要15金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

分子遗传学基因组及基因组学.ppt

第二章基因和基因组,2.病毒基因组2.1 病毒基因组的结构多样性（1）双链DNA病毒基因组（2）单链DNA病毒基因组（3）正链RNA病毒基因组（4）负链RNA病毒基因组（5）双链RNA病毒基因组（6）反转录病毒基因组,2.2 反转录病毒基因组的结构与功能,2.3重叠基因与病毒基因组中特征序列的结构和功能,重叠基因黏性末端末端丰余循环排列回文序列末端反向重复序列分段基因组帽子和poly(A)结构,2.3 原核生物基因组2.3.1 大肠杆菌基因组,Escherichia coli 基因组大小为4.7106bp双链环状DNA分子，拟核结构；具有操纵子结构，K-12 MG1655有2584个操纵子,其中推定的2192个操纵子中，73仅有1个基因，16.6%有2个，4.6有3个，6有4个或更多个基因。在2405个已知启动子的操纵子中，68只有1个启动子，20有2个，12有3个或更多个启动子；,6.数个操纵子还可以由一个共同的调节基因（regulatory gene）即调节子（regulon）所调控；7.除了编码rRNA的rrn基因是多拷贝,一般情况下结构基因都是单拷贝；8.不编码的基因组DNA部份所占比例比真核细胞基因组少得多；9.在基因组中编码顺序一般不会重叠.,接合是通过细菌细胞直接的接触，遗传信息从给体单向转移到受体从而实现遗传重组的过程。接合能传递大段的DNA，在细菌的遗传重组中是效率最高的。,转化也称遗传转化（genetic transformation）是指同源或异源的游离DNA分子（质粒和染色体DNA）被自然或人工感受态细胞摄取，并得到表达的基因转移过程,转导是通过噬菌体感染将DNA或RNA转入宿主细菌细胞并产生新性状的过程。普遍性转导（generalized transduction）普遍性转导是通过噬菌体将给体菌的任何一种遗传标记转入受体菌的过程。噬菌体细菌时，细菌染色体断裂成许多小片段。在噬菌体DNA装入外壳蛋白组成新的噬菌体时，大约在105107次装配中有一次装配错误。误将宿主细胞残留的DNA片段装入噬菌体的外壳蛋白中，成为一个转导性的噬菌体。该转导性噬菌体吸附到受体细菌上，并注入其内含物，通过同源重组形成转导子。,局限性转导（specialized transduction）噬菌体只是转导供体菌某些基因的转导过程。噬菌体只能转导 E.coliK12 染色体 DNA 上的半乳糖基因(gal)和生物素基因(bio)。这是因为该噬菌体仅能整合在供体菌染色体 DNA 的特定位置（半乳糖基因与生物素基因）上。在解离过程中偶然发生错误就会形成携带gal或bio基因的缺陷噬菌体，在感染受体菌后就能高效转移这两种基因。,断裂基因（split gene）即不连续基因（interrupted gene）一个基因被不编码蛋白质的DNA片段分割成不连续的几部分，叫做断裂基因(interrupte gene)。Gilbert将在前体RNA拼接产生mRNA过程中丢失的片段称为内含子(intron)，而将拼接后表达的片段称为外显子(exon)。研究真核生物mRNA的内含子后发现，其两侧边界均有一对保守顺序，即5-端为GU，3-端为AG，这类称为GU-AG的内含子均以相同方式剪切。,在不同的真核生物中，内含子的一致顺序有不少变化。动物中典型的剪接位置一致顺序组成为：5-AGGUAAGU-YNYURAY-Y10-20-YAG-3 其中Y为U或C，N为任何核苷酸，箭头所指为外显子与内含子的交界。5端剪接位点称供体位点（donor site，5site,left splicing site），3端剪接位点称受体位点（acceptor site，3site,right splicing site）。内含子中还有另一段识别剪接边界必不可少的序列称为分枝点(branch site)，位于3-端剪接位的上游，具有特征性序列组成：-YNCURAY-，紧接在分枝点的下游有一段多嘧啶序列，也是参与剪接事件蛋白接合的位置。,2.4 真核生物基因组真核生物基因组大小与C值悖理和N值悖理基因组是指一个细胞或病毒所包含的全部基因。通常在真核生物中指一个物种的单倍体染色体组所含有的一整套基因。生物体的单倍体基因组所含DNA的总量称为C值（单位为：DNA pg或bp或Kb或Mb/某个单倍体基因组）。基因组的大小大致上与进化的复杂性有关。生物基因组的大小同生物在进化上所处地位的高低及复杂性之间无严格的对应关系，这种现象通常称为C值悖理(C-value paradox)。物种的基因数目与生物进化程度或生物复杂性的不对应性，这被称之为N（number of genes）值悖理(N value paradox)或G（number of genes）值悖理。,真核生物DNA的复性动力学单链DNA所占百分数C/Co 是DNA浓度Co同反应时间t乘积的函数，通常用Cot来表示当复性反应完成一半时(C/Co1/2,t=1/2),这时的Cot值定义为Cot1/2,CoT1/2值的特性当条件一定时，CoT1/2值的大小与DNA的分子量及复杂性有关。DNA分子的复杂性是指最长的没有重复序列的核苷酸对的数目。CoT1/2值越大，表示复性速度越慢，DNA的分子量越大，在不存在重复序列的情况下,值与基因组的大小成正比，在有重复顺序的复性中,在同一个复性曲线上的各动力学组分的并不因基因组的大小而增减,而是与DNA序列的重复频率成反比。复性动力学提供真核基因组序列信息原核生物基因组DNA多为单一序列，真核生物基因组DNA有重复序列。原核生物基因组的曲线通常只有一个拐点，曲线是单一的S形曲线；而真核生物基因组DNA曲线通常有几个拐点，真核生物基因组的曲线是多S形曲线，由若干个（一般23个）S形加合成的曲线。,单一序列(unique sequence)又称“单拷贝序列（single-copy sequence）”,“非重复序列（nonrepetitive sequence）”。在基因组中只含有一个拷贝的序列叫单一序列。轻度重复序列(slightly repetitive sequence)一般在一个基因组内有210份拷贝，但有时23份拷贝的DNA序列也被视作非重复序列。中度重复序列（moderately repetitive sequence）一般指10份到几百份拷贝的DNA序列。高度重复序列(highly repetitive sequence)重复次数极高，一个基因组中有几百份甚至几百万份拷贝的高度重复序列。,重复序列家族基因组内一些高度相似的重复序列构成重复序列家族(repetitive sequence family)，这些重复序列包括基因和基因外的序列。真核生物基因组中来源相同、结构相似、功能相关的一组基因称为一个基因家族(gene family)。串联重复序列家族串联重复序列是指不同数目的核苷酸（简单序列）的重复拷贝串联在一起的高度重复序列，一般重复单元为2200bp,主要为卫星DNA(satellite DNA)，按重复单位可将卫星DNA分为两类：小卫星DNA(minisatellite DNA)一般由长550个核苷酸的重复单元组成。根据其在染色体上所处的位置和重复单元的长度，有两种形式的小卫星DNA，一种是端粒DNA，另一种位于亚端粒区，称为可变数目串联重复（varible number tandem repeat，VNTR）,是由短重复单元（640bp）串联重复（6100次以上）而成的DNA序列。微卫星DNA(microsatellite DNA)。也称为短串联重复（short tandem repeat,STR）是由26个核苷酸组成的重复单元串联重复（1060次）而成的简单重复序列，如和等，三核苷酸和四核苷酸重复相对较少。,散在重复序列家族是分布于基因组内散在的重复序列，一般为中等重复序列。根据其重复序列的长短，可分为短散在重复序列（short interspersed repeated sequence）又称为短散在核元件（short interspersed nuclear elements,SINEs）和长散在重复序列(long interspersed repeated sequence)又称为长散在核元件（long interspersed nuclear elements,LINEs）。SINE长约500bp，拷贝数在10万以上，例如人的Alu序列。LINEs长约67kb,在哺乳动物基因组中有2万5万个拷贝，它们组成L1家族，主要含有反转录转座子。,基因家族由同一个祖先基因经过重复与变异、进化而形成结构与功能相似的一组基因组成一个基因家族(gene family)。基因家族中的各个成员可以聚集成簇也可以分散在不同染色体上。根据结构和功能以及在发育过程中的表达情况，基因家族可以分为：简单的多基因家族（simple multigene families）,复杂的多基因家族（complex multigene families）发育控制的复杂多基因家族(developmentaly controlled complex multigene families),简单的多基因家族由结构相同的一个或数个基因以串联方式重复排列的形式存在于染色体上。真核生物核糖体（rRNA）基因簇是典型的简单的多基因家族,有18S、5.8S、28S和5S 等4种rRNA基因，前3种主体rRNA,与后一种5S rRNA基因分开位于不同的染色体或相同染色体的不同位置。主体rRNA基因按18S-5.8S-28S顺序包含在约7800bp185000bp的一个rDNA重复单元中，其前体为45S rRNA，此前体经加工形成成熟的rRNA。重复次数在5010000左右。5S rRNA基因家族中各个5S rRNA基因之间为26倍长的间隔序列所隔开，例如果蝇的5S rRNA基因有165个拷贝，重复单元为375bp,其中编码区长度恒定为120bp，间隔区为2505bp。,复杂的多基因家族各个成员并不都相同，数个功能相关的基因串联成簇由间隔序列分开，分别转录出各自的mRNA。组蛋白基因属于这一类型。在海胆和果蝇中，编码H1、H2A、H2B、H3和H4这5种组蛋白的基因彼此靠拢，串联在一起，构成一个重复单元.每个重复单元长约6000bp左右，在海胆中重复300600次，在果蝇中重复100次左右。每个重复单元中的组蛋白基因，被转录间隔区序列隔开，它们可以以相同的方向转录如海胆组蛋白基因，也可以按不同反向转录如果蝇组蛋白基因，但共同特点之一是这些组蛋白基因内都无内含子。哺乳动物组蛋白基因的排列没有任何规律的极性或重复一致性，但它们都是一类中度重复序列，是重复序列中唯一在正常情况下能够翻译出蛋白质的基因。,发育控制的复杂多基因家族功能相关的基因分别串联成簇，在生物个体发育过程中按一定的顺序表达或关闭,这些基因家族成员随着发育阶段的变化而先后出现.例如人类血红蛋白就属于这类基因家族所编码，该基因家族中的不同成员在胚胎不同时期、儿童和成人组织中表达。基因家族中的一些成员聚集在DNA的一个区域内，而另一些成员分散在不同的染色体上。人类-珠蛋白基因和-珠蛋白基因分别位于第16号染色体和第11号染色体上，每个基因家族都包括有功能的基因和假基因。有功能的基因分别在不同的发育时期表达.,假基因核苷酸序列与相应正常功能基因基本相同，但没有编码蛋白质能力的基因或不产生有功能产物的基因称为假基因（Pseudogene）。假基因经常用希腊字母来表示，如血红蛋白基因家族中的类珠蛋白基因簇的、1、2和类珠蛋白基因簇的等。产生假基因的原因很多，如编码顺序出现终止密码子突变，或者插入和缺失某些核苷酸使mRNA移码，造成翻译中途停止或异常延伸，合成无活性的蛋白质等。根据起源和结构的不同，假基因一般分为两类：未加工的假基因(nonprocess pseudogenes)和加工的假基因(processed pseudogenes)。,未加工的假基因是通过基因组DNA重复产生的，经常位于有功能的相同基因拷贝的附近，保留着祖先基因的组成特点。它们与有功能的同源基因有类似的结构，原来可能是有功能的基因，但由于缺失、倒位或突变等原因使该基因失去活性成为无功能基因。加工的假基因也称为反转录假基因(retropseudogenes)，是由RNA反转录为cDNA后再随机整合到基因组中而产生的。因此，它们在基因组中经常是分散的。加工假基因是由反转录因子编码的反转录酶和整合酶的外来活性而产生的，只在真核生物中被发现。加工的假基因结构对应于起源基因的转录单位，但缺乏内含子和侧翼顺序。因为缺乏侧翼顺序，加工假基因一般不表达。,超基因与超基因家族超基因（supergene）是指真核生物基因组中紧密连锁的若干个基因座，它们作用于同一性状或一系列相关性状。例如，以上所述的人类基因组的血红蛋白基因簇就是一个超基因。一类是类珠蛋白基因簇，包括、及基因，位于16号染色体；另一类是类珠蛋白基因簇，包括，（A和G），和，位于11号染色体。但是在个体发育的不同时期，这些基因簇的不同基因进行表达，各种血红蛋白的合成彼此十分协调，以保证人体正常生长发育过程中对血红蛋白的需要。,超基因家族（supergene family）是DNA序列相似，但功能不一定相关的若干个单拷贝基因或若干组基因家族的总称。例如：免疫球蛋白超基因家族,ras超基因家族等。它们是一个共同的祖先基因通过各种各样的变异，产生了结构大致相同但功能却不尽相似的一大批基因。这一大批基因分属于不同的基因家族，但可以总称为一个基因超家族.,真核生物染色体的结构与功能常染色质和异染色质结构异染色质和兼性异染色质,复制原点是染色体上开始合成新的DNA的那个部分，约100多bp长，又称为自主复制序列(autonomously replicating sequence，ARS)端粒是由独特的DNA序列及相关蛋白质组成的线性真核染色体的末端结构，它具有防止末端基因降解、染色体末端间的粘连和稳定染色体末端及其精确复制等功能。着丝粒是细胞分裂中期两条染色单体相互联结的部位，该处为染色体的缩窄处，故又称为主缢痕。着丝粒染色质既含有组蛋白和其他的蛋白质，也含有DNA，而其DNA的序列是很特殊的，能够促进与纺锤体的相互作用。,异染色体形成中的因子异染色质形成的分子机制很复杂，在多种因子的作用下有多种途径。促使异染色质形成的因子有：组蛋白、修饰组蛋白的酶（翻译后修饰）、组蛋白结合因子、DNA甲基化、重复DNA序列、序列特异的DNA结合蛋白以及非编码的RNAs等。,异染色体结构域的形成异染色质的形成与其所在位置的DNA序列密切相关。一般来说，异染色质形成的主要靶区是象转座子和卫星DNA这样的重复序列。,异染色质与基因沉默染色质重塑（chromatin remodeling）、转座子、DNA甲基化及其RNA干扰（RNAi）等都与基因沉默有关。但是，这些造成基因沉默的方式也都与染色质的异染色质有直接或间接的关系。,甲基化的序列通常被DNA结合蛋白（如 MeCP2）所识别，这些DNA结合蛋白可以募集组蛋白脱乙酰酶和组蛋白甲基化酶，而这两种酶可以修饰邻近的染色质。因此，DNA的甲基化能够标记随后异染色质所形成的位置。,常染色质基因表达的分子基础真核生物的基因表达实际上涉及到各种水平上的调控问题，包括DNA水平的调控，转录前水平的调控，转录水平的调控，转录后水平的调控，翻译水平的调控和翻译后水平的调控等多种途径（见以后各章）。但归根到底都与染色质的结构和功能有关。核心组蛋白对转录的作用组蛋白H2A、H2B、H3和H4是核心组蛋白，只有当DNA存在时它们才能组装成一种有序的结构。核小体在细胞中有两个重要功能：压缩DNA 以适应细胞核大小和限制DNA的易接近性。细胞广泛利用后一种功能来调控许多不同DNA的行为，包括基因表达。,核小体与基因表达核小体是染色质的基本结构单位。但是，体内外实验均证实,核小体是基因转录的通用抑制子。细胞内基因组包裹在核小体内，如果启动子区在核小体中，则转录通常会被抑止。,(占先模型pre-emptive model)染色质转录的占先模型认为组蛋白和转录因子竞争DNA，决定的因素是谁先占据调控位点。如在启动子部位已形成了核小体，那么转录因子和RNA聚合酶是不能与启动子（DNA）结合的；如转录因子和RNA聚合酶在启动子上形成稳定的转录起始复合体，那么组蛋白则将被排除在外。,动态模型(dynamic model)与占先模型不同，动态模型认为染色质结构的改变是通过转录因子取代组蛋白，涉及蛋白质蛋白质、蛋白质DNA之间的相互作用和接触，必须有ATP参与，需要能量的大量输入。在ATP水解释放的能量驱动下，各种转录因子将核小体从所需的DNA序列中置换出来，组蛋白从染色质中解聚并释放。实验发现有些转录因子在结合DNA和/或建立能够使核小体定位在结合位点周围的边界时能够干扰核小体的形成。,核小体定位与核小体定位密码核小体是染色体的最基本结构单位，因此核小体在DNA上的精确定位对细胞正常功能的发挥起重要作用。由于核小体与DNA的动态相互作用，大多数核小体的位置是不固定的。但是在有些情况下，某些核小体被限定在基因组的固定位置上，或者说DNA序列仅以一种特定的构型组装成核小体，则DNA上的每个位点将一直位于核小体上的特定位置，我们称这种组装类型为核小体定位（Nucleosome positioning）,异染色质与基因沉默染色质重塑（chromatin remodeling）、转座子、DNA甲基化及其RNA干扰（RNAi）等都与基因沉默有关。但是，这些造成基因沉默的方式也都与染色质的异染色质有直接或间接的关系。,异染色质与基因沉默染色质重塑（chromatin remodeling）、转座子、DNA甲基化及其RNA干扰（RNAi）等都与基因沉默有关。但是，这些造成基因沉默的方式也都与染色质的异染色质有直接或间接的关系。,1.如果两个DNA结合蛋白与DNA结合位点的距离小于DNA组装成一个核小体所需的最小长度（约150bp），则这两个蛋白质之间的DNA不与核小体结合；2.一些DNA结合蛋白具有与核小体结合的能力，与邻近的核小体紧密作用，导致核小体立即优先地在与这些蛋白质相邻的位置组装.,核小体定位的另一种方式涉及特定的DNA序列，这些序列对核小体有高度的亲和性。由于DNA在与核小体结合的过程中会剧烈弯曲，所以具有内在弯曲倾向的DNA序列可以定位核小体。A:T 碱基对有向DNA双螺旋小沟弯曲的内在趋势，G:C 碱基对则有相反的趋势。因此，富含A:T 的DNA有利于组装核小体，其小沟面对组蛋白八聚体,核小体的形成及其在染色质上的精确定位有以下两方面的作用：提供一个支架结构(scaffold),使转录因子之间的信息传递更有效；染色质结构的不均一性，即其某些区域不形成核小体,从而保证了转录因子易于接近染色质模板。,基因组编码一种内在的核小体定位密码（nucleosome positioning code）。这种“定位密码”由序列上出现的每10个碱基的周期信号组成（图238）。这种信号的规则重复帮助DNA片段剧烈的弯曲成核小体所需的球状。,染色质的复制和转录“复制体通过核小体的移动模型”（Model of the movement of replisomes past nucleosomes）提出，当复制体经过复制叉时，核小体分成两个半核小体，经过复制叉在复制叉后这各个半核小体再彼此重新组装成一个个完整的核小体.用密度转化实验来检验核小体复制模型时，核小体在两个子代DNA分子中都被发现既包含老组蛋白（复制前的）复合体，也包括新的（复制后的）复合体。这样在蛋白质水平看，核小体的复制组装似乎是经过一个分散机制进行的。“半核小体综合模型”认为老核小体通过复制叉后，两个半核小体附着于一个子链上，然后重新组装成一个核小体，因而没有新、老组蛋白混合形成的核小体。,DNA复制后核小体组蛋白的组装上有所不同。首先是复制时不保留组蛋白八聚体，但是保留了H2AH2B二聚体和H3H4四聚体。DNA复制后核小体立即被组装，组装的第一步是结合一个H3H4四聚体。一旦四聚体结合后，两个H2AH2B二聚体接着结合形成最终的核小体。H3H4四聚体和H2AH2B二聚体或是全由新的组蛋白或是全由老的组蛋白所组成,这种组装是需要组蛋白伴侣参与并指导的。,注：CAF 染色质装配因子：chromatin assembly factor；NAP-1 核小体装配蛋白 nucleosome assembly protein;PCNA:proliferating cell nuclear antigen 增值细胞核抗原,染色质转录模型,转录起始是伴随着染色质上的一些DNA基因调节序列或者周围核小体结构的改变而开始。首先，在酵母中发现一种称为SWI/SNF的染色质结构重塑复合物，该复合物也常是转录起始复合体的一个组分。SWI/SNF复合物中存在多个NTP结合蛋白，具有ATP驱动的DNA转位活性，可改变组蛋白与DNA的相互作用，依靠SWI/SNF复合物诱导染色质核小体解聚，以帮助转录因子结合到DNA上；此外，还有一类核心组蛋白结合蛋白，在核小体上除去H2AH2B，以此帮助转录因子结合到活性核小体DNA上；另外，组蛋白的乙酰化和磷酸化也能使染色质核小体结构发生变化。,“核小体换位绕轴模型”认为DNA转录时核小体按全保留的成环机制使RNA聚合酶通过核小体完成转录。基本过程：首先，RNA聚合酶（RP）与正位于上游核小体的启动子（P）结合，开始转录，B为核小体核心DNA与上游DNA之间的边界；当RNA聚合酶接近该边界B时，诱导紧挨核小体的下游DNA开始绕核小体核心组蛋白轴解旋，并与其脱离，露出组蛋白8聚体表面；脱离出来的DNA上游端接触核心组蛋白表面，结果形成一个环结构，其中RNA聚合酶结合DNA于环中；当RNA聚合酶继续前进时，原来的核心组蛋白绕轴解旋后，上游的DNA在转录过程中象纺纱丝一样围着核心组蛋白绕轴缠绕；由于绕轴缠绕的转动，上游的DNA代替原来的DNA，在RNA聚合酶经过后重新形成核小体，释放出的DNA下游使RNA聚合酶通过，重复以上过程直到转录完成。,Studitsky等（2004）提出了RNA聚体酶转录染色质基因的理论机制：当RNA聚体酶沿着真核基因转录时，它按一定方式转变与DNA结合的组蛋白八聚体为六聚体，借助延伸因子FACT（facilitates chromatin transcription）、组蛋白修饰或组蛋白变异体等易于得到这一结果。H2AH2B二聚体从核小体中的瞬时脱落可创造一个利于染色质重塑或DNA结合蛋白结合进出的机会。RNA聚合酶转录经过后，完整的核小体逐渐被恢复。转录也会导致核小体重新分布和部分核小体的损耗。,灯刷染色体的重要特性是减数分裂期时间长、染色体疏松而又长又大、存在大量的侧环（lateral loop）。,多线染色体（polytene chromosome）由于染色体反反复复进行核内复制（endoduplication），而核或细胞不分裂，由很多纵向密集在一起的染色丝束集在一起.,

注意事项

本文（分子遗传学基因组及基因组学.ppt）为本站会员（小飞机）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。