篇医学遗传学基础 第一章人类基因和基因组ppt课件.ppt
第一篇 医学遗传学基础(疾病发生的遗传学机制)第一章 人类基因和基因组,第一节 基因的概念,DNA分子的组成DNA分子结构,第二节 基因的化学本质,第三节 细菌的基因组,基因的结构 基因组的组成,第四节 基因的生物学特性,遗传信息的储存单位 基因的自我复制 基因表达 基因表达的调控,第五节 人类基因组计划,结构基因组学 后基因组学,第一节 基因的概念,是原核、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位和突变的单位以及控制性状的功能单位。 生物化学概念:一段DNA或RNA顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。 遗传学概念:代表一个遗传的功能单位,同时也是一个交换单位和突变单位。,基因,20世纪50年代以前,主要从细胞的染色体水平上进行研究,属于基因的染色体遗传阶段。 20世纪50年代,主要从DNA大分子水平上进行研究,属于基因的分子生物学阶段。 20世纪80年代以后,研究基因的功能及其与表型之间的关系,使基因的研究进入了反向生物学阶段。,基因,基因结构研究的历史,基因研究大体的三个阶段:,基因结构研究的历史,从遗传学史的角度看,基因概念大致分以下几个阶段:,泛基因(或前基因),遗传学的奠基人孟德尔(Gregor Johann Mendel 18221884),19世纪60年代初,孟德尔对具有不同形态的豌豆作杂交实验,在解释实验中每种性状的遗传行为时,用A代表红花,a代表白花,表明生物的某种性状是由遗传因子负责传递的,遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟德尔所说的“遗传因子”是代表决定某个性状遗传的抽象符号。,基因的两个基本属性: 基因是世代相传的; 基因是决定遗传性表达的。,现在所说的“基因是生物体传递遗传信息和表达遗传信息的基本物质单位”,实际上就是孟德尔所阐明的基因观。,1926年,摩尔根的巨著基因论出版,从而建立了著名的基因学说。, 基因是染色体上的实体; 基因象链珠(bead)一样,孤立地 呈线状地排列在染色体上; 基因是,功能突变 交换,“三位一体”的 (Three in one),最小的 不可分割的基本的,遗传单位。,1957年,本泽尔(Seymour Benzer)以T4噬菌体为材料,在DNA分子水平上研究基因内部的精细结构,提出了顺反子(cistron)概念。,对经典的基因概念的 第一次重要修正与发展,顺反子假说(Theory of cistron), Cistron 是基因的同义词在一个顺反子内,有若干个突变单位 突变子在一个顺反子内,有若干个交换单位 交换子基因是一个具有特定功能的,完整的,不可分割的 最小的遗传单位。 three in one one in one基因内可以较低频率发生基因内的重组,交换 。, one gene one enzyme one gene one peptide one gene one function,Lac. Operon,Lactose,操纵子理论,基因功能的表现是若干基因组成的信息表达的整体行为。,I P O Z Y A,z,y,a,根据其是否具有转录和翻译功能可以把基因分为三类:编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码调节蛋白的调节基因;只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因;不转录的基因,它对基因表达起调节控制作用,包括启动子和操纵基因。启动子和操纵基因有时被统称为控制基因。,基因主要位于染色体上,还有染色体外遗传物质。,基因概念的发展,移动基因 DNA能在有机体的染色体组内从1个地方跳到另一个地方,它们能从1个位点切除,然后插入同一或不同染色体上的另一个位置。移动基因机构简单,由几个促进移位的基因组成。基因的跳动能够产生突变和染色体重排,进而影响其他基因的表达。 断裂基因 真核蛋白质编码基因的核苷酸序列中间插入有与编码无关的DNA间隔区,使1个基因分隔成不连续的若干区段 。重叠基因 一些噬菌体和动物病毒,不同基因的核苷酸序列有时是可以共用的。,内含子(intron) 位于基因内部,不编码基因产物的序列,在成熟mRNA中被切除。外显子(exon) 一个基因不包括内含子的任何编码序列,其mRNA相应区域可翻译成蛋白。,外显子和内含子中发生突变的概率是相同的,但是内含子的突变率总是高于外显子,为什么?,2.增加变异机率, 有利于生物的进化,1977年Sanger在研究X174时发现的。X174是一种单链DNA病毒,宿主为大肠杆菌,因此,又是噬菌体。它感染大肠杆菌后共合成11个蛋白质分子,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。而该病毒DNA本身只有5375个核苷酸,最多能编码197kDa蛋白质,实际上编码263kDa蛋白质。,如:B和A, E和D 其读码结构互不相同,一个基因完全在另一个基因内部,如: K和C,-TAATG-,D 终止密码子,J 起始密码子,部分重叠,两个基因共用少数碱基对,如: D和J,第二节 基因的化学本质,一、DNA分子的组成,1.DNA基本组成单位:脱氧核苷酸;2.脱氧核苷酸组成:磷酸、脱氧核糖和含氮碱 基;,一、DNA分子的组成,3.四种碱基:腺嘌呤(adenine,A) 鸟嘌呤(guanine,G) 胞嘧啶(cytosine,C) 胸腺嘧啶(thymine,T),一、DNA分子的组成,4.四种碱基构成的四种脱氧核苷酸: 脱氧腺嘌呤核苷酸(dAMP,A) 脱氧鸟嘌呤核苷酸(dGMP,G) 脱氧胞嘧啶核苷酸(dCMP,C) 脱氧胸腺嘧啶核苷酸(dTMP,T)5.四种脱氧核苷酸按一定顺序排列成DNA单链, 两个相邻脱氧核苷酸由磷酸二酯键连接。,一、DNA分子的组成,6.每条脱氧核苷酸单链都有3端和5 端。7.生物的遗传性状以脱氧核苷酸的排列来储存遗传信息。8.脱氧核苷酸的排列是DNA遗传的核心。,二、DNA分子结构,DNA分子的双螺旋结构模型,1.DNA由两条碱基互补的、反向平行排列的脱氧多核苷 酸单链组成; 一条是5 3方向,另一条是3 5方向; 碱基互补的方式:A与T或T与A,C与G或G与C; A与T间由2个氢键相连,C与G间由3个氢键相连。氢键维持双链横向稳定性,碱基堆积力维持双链纵向稳定性。,二、DNA分子结构,DNA分子的双螺旋结构模型,2.自然情况下,绝大多数DNA分子的 两条互补链围绕一“主轴”向右 盘旋形成双螺旋结构。3.四种碱基(A、T、G、C)的排列 顺序在不同的DNA分子中各不相同, 蕴含各种生物性状的遗传信息。,二、DNA分子结构,DNA分子的双螺旋结构模型,4.双螺旋表面形成两条凹槽,一面宽而深,称之为大沟(major groove),另一面狭而浅,称之为小沟(minor groove)。两条沟,对于有特定功能的蛋白质(酶) 识别并调节DNA双螺旋结构上的遗传信息非常重要。,二、DNA分子结构,DNA分子的双螺旋结构模型,5.DNA分子相对分子质量巨大,碱基对的排列方 式多种多样,导致DNA分子种类繁多。复杂的 DNA分子内蕴藏着生物界无穷无尽的遗传信息, 决定了自然界生命的多样性。,第三节 人类基因和基因 组的结构特点,人类基因组(human genome)是人体所有遗传信息的总和。 人类基因组包括两个相对独立而相互关联的基因组:核基因组(nuclear genome)和线粒体基因组(mitochondrial genome)。,一、基因的结构,(一)基因的分类,一、基因的结构,(一)基因的分类,人类基因组约有20000-22000个基因,与蛋白质合成相关的基因序列只占整个基因组序列的1.1%左右;4%为基因调控序列和RNA基因序列;20%为内含子、基因非翻译区序列及假基因;75%为基因外序列,55%为重复DNA序列。 人类基因组中的功能序列可分为四大类:,一、基因的结构,(一)基因的分类,1.单一基因(solitary gene) 人的基因中,25%-50%的蛋白质基因在单倍体基因组中只有一份,称为单一基因或单一序列(unique sequence)。,一、基因的结构,(一)基因的分类,2.基因家族(gene family) 已克隆的许多基因都不完全是单拷贝,有重复的多拷贝,这一部分基因属于两个或更多个相似基因的家族,称为基因家族。 类同的蛋白质则组成蛋白质家族(protein family),蛋白质成员可达数百个。,一、基因的结构,(一)基因的分类,3.假基因(pseudogene) 一种畸变基因,核苷酸序列与有功能的正常基因有很大同源性,但由于突变、缺失或插入以至不能表达,因而没有功能的基因。,一、基因的结构,(一)基因的分类,4.串联重复基因(tandem repetitive sequence) 45SrRNA、5SrRNA、各种tRNA基因以及蛋白质家族中的组蛋白基因是呈串联重复排列的,这类基因称为串联重复基因。,一、基因的结构,(二)割裂基因(split gene),真核生物的结构基因是割裂基因,由编码序列(外显子,exon)和非编码序列(内含子,intron)组成,两者相间排列,不同基因所含内含子数目和大小各不相同。,一、基因的结构,(二)割裂基因(split gene),由于mRNA剪接加工的方式不同,使得编码不同的多肽链的基因时外显子和内含子的关系不固定,这种关系产生了基因的差异表达,构成割裂基因结构上的一个重要特点。,一、基因的结构,(二)割裂基因(split gene),每个割裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区称为侧翼序列(flanking sequence),包括启动子、增强子及终止子。 启动子:位于基因转录起始点上游100200bp处(范围);是RNA聚合酶与模板DNA(转录因子)互相作用的核苷酸序列或结合区段,是识别转录起始部位的信号,能启动基因转录;目前已发现有三种启动序列:即“TATA框“CAAT框”和“GC框”。(或称三个DNA序列元件)。 增强子:“增强子”是一个短序列元件,特异性地结合于转录因子,能增强基因的转录活性,它可以位于转录起始点的上游,也可以位于下游,与与启动子相距1000bp3000bp以上, 当它被激活时,转录活性增强200倍以上。,一、基因的结构,(二)割裂基因(split gene),终止子:“终止子”位于3非编码区下游,由AATAAA段反向重复(回文序列)、(倒位重复)组成,AATAAA是PoolyA(多聚腺苷酸)附加信号,PolyA构成转录的终止信号,因回文序列转录后形成发夹结构,阻碍RNA聚合酶连续移动,转录终止。,En: 增强子; P1 . P2 . P3 启动子(TATA 框、CAAT 框、GC 框); E: 外显子; I: 内含子; UT: 非翻译区; GT-AG: 外显子- 内含子接头 主体部分(编码区)内含子、外显子侧翼顺序(调控区)启动子(TATA框、CAAT框、GC框)、增强子、终止子,一、基因的结构,(二)割裂基因(split gene),割裂基因结构中外显子-内含子接头区是高度保守的一致序列,称为外显子-内含子接头,是割裂基因结构上的又一重要特点。 每个内含子5 端起始两个碱基是GT,3端最后两个碱基是AG,这种接头形式叫GT-AG法则。 各种真核生物基因的内含子中的接头均相同。,一、基因的结构,5.AGCCGACTATGTCGAAGCTT.GCTTGACTATAAGACA33.TCGGCTGATACAGCTTCTAA.CGAACTGATATTCTGT5转录调控区 贮存RNA或蛋白质结构信息区 转录终止区,二、基因组的组成,(一)单拷贝序列,指在单倍体基因组中只出现一次或数次,在人类基因组中约占60-65%;大多数编码蛋白质的结构基因属这一类。 又称非重复序列或单一基因,在基因中仅有单一拷贝或少数几个拷贝,长度在800-1000bp之间。,二、基因组的组成,(二)重复多拷贝序列,高度重复序列重复频率可达106次,包括反向重复序列、卫星DNA等,约占10-15%;这类DNA由非编码的DNA重复串联排列,分散或局限在基因组的某区域,高度重复,分为:高重序列(串联重复)和反重序列(散在重复)。1.串联重复:在一个基因组中存在大量拷贝的DNA序列,重复的拷贝数106108,散在分布于基因组中,占基因组DNA10%30%,这些序列通常很短,一般在6200bp,因序列短缺乏转录必须的启动子,故没有转录能力,不编码任何Pr,高度重复序列大多集中在异染色质区。,二、基因组的组成,(二)重复多拷贝序列,1.串联重复功能 参与复制水平的调节;如反向重复序列常存在于DNA复制起点区的附近,是一些蛋白质的结合位点;参与基因表达的调控;参与染色体配对。2.散在(中度)重复DNA序列和其他可动DNA因子 以不同的量分布于整个基因组的不同部位,在一个基因组中出现102105拷贝的DNA序列,长度为3007000bp,这些DNA序列在长度和拷贝数量上有很大的差异,占整个基因组的2540%,它可分为两类:,二、基因组的组成,(二)重复多拷贝序列,2.散在重复DNA序列和其他可动DNA因子短散在重复元件(short interspersed nuclear elements,SINES) 即短分散核元件,占人类基因组的7%,这些间隔的DNA长度300500bp,但拷贝数目可达75万个以上,这些分散核元件常位于基因的非编码区,可能与基因表达的调控有关。长散在重复元件(long interspersed nuclear elements,LINES) 即长分散核元件,占人类基因组的5%,长度可达60007000bp,拷贝数目在20-50万个。 核元件:指间隔的DNA片段,尤其是指那些中度重复的DNA。,第四节 基因的生物学特性,一、遗传信息的储存单位,(一)遗传密码,DNA转录的mRNA链上每3个相邻碱基序列构成一个三联体,每个三联体能编码一种氨基酸,三联体又称三联体密码、遗传密码或密码子,遗传密码是遗传信息的具体表现形式。 mRNA链上4种碱基以三联体形式组合成43,即64种遗传密码。其中61种为20种aa编码,3种为终止密码。,一、遗传信息的储存单位,(二)遗传密码的特性,1.通用性:一般情况下病毒、原核生物、真核生物、人类都能通用。2.简并性:几个密码编码一种aa。3.起始密码和终止密码:有的既可作起始密码,也可编码aa.如AUG既是起始密码又能编码甲硫氨酸。另有UAA、UAG、UGA不编码任何aa,只作终止密码。,二、基因的自我复制,(一)DNA双螺旋结构解旋为两条单股的多核苷酸链,基因复制是以DNA复制为基础的,真核生物DNA分子上有多个复制起始点,一个复制起始点所复制的DNA区段为复制单位,称“复制子”。,DNA双螺旋分子在解旋酶的作用下解旋、氢链断开、两链分开。两条链根据自身的碱基在细胞核中按互补的原则进行碱基配对,即A=T、T=A、CG、GC,又在连接酶作用下形成一条新多核苷酸链,并与原有的多核苷酸母链形成新的双螺旋结构。,二、基因的自我复制,(二)DNA分子的每一股单链都可作为模板进 行自我复制,1、互补性:即子链与模板链碱基互补。2、半保留性:DNA分子以两条链各为模板合成新DNA的过程,新合成DNA双链中保留了一条原有DNA分子的旧链,故称“半保留复制”。3、反向平行性:即53 35。4、不对称性:DNA的复制是不对称的,即以 35复制时,子链是连续的,而53复制时,子链是不连续的,首先在引发体的起始引发下合成大量DNA小片段 ,称冈崎片段,冈崎片段在DNA连接酶作用下连接成一条长链。5、不连续性:即复制子。,三、基因表达,(一)转录,在RNA聚合酶催化下,DNA以一条链为模板,以ATP、CTP、GTP、UTP为前体RNA合成RNA的过程称“转录”;或:DNA将遗传信息传递到RNA的过程。1.转录过程 转录在细胞核中进行,53方向转录;一般包括起始、延伸和终止3个连续步骤;转录要在启动子和RNA聚合酶的作用下从转录起始点开始,以碱基因互补的方式合成一个RNA。这种新合成的RNA称核内异质RNA或不均一核RNA(hnRNA)。DNA中35称有义链(模板链)或Watson链,另一条则称编码链或Criek链或称反义链。RNA聚合酶在DNA模板上移动到达终止信号时,RNA合成停止。,三、基因表达,(一)转录,2.转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。(1)戴帽(加帽):即在初级转录物5端加上一个甲基化核苷酸,即加上“7-甲基鸟嘌呤核苷酸”帽,封闭了3RNA的5端称加帽。 加帽的功能: 保护RNA转录本避免外切核苷酸酶53消化;有利于RNA从细胞核运到细胞质;便于RNA剪接;有助于细胞质中的核糖体识别mRNA。,三、基因表达,(一)转录,2.转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。(2)加尾:即在初级转录物3端加上“多聚腺苷酸”尾,也称POlyA化。 加尾的作用: 促使mRNA从核进入质;稳定mRNA分子;有利于核糖体识别mRNA。,三、基因表达,(一)转录,2.转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。(3)剪接:转录是把基因的外显子和内含子转录成RNA序列,这个原始RNA转录本称为异质RNA(hnRNA)或称为不均一核RNA。在剪接酶的作用下,把内含子非编码序列切除,再将外显子编码序列由连接酶逐段连接起来,形成成熟的mRNA分子,称“剪接”。 每个内含子的5端起始处有GT序列,3端尾部有AG序列,这两个序列为高度保守的一致序列,它们是酶切和拚接的信号。 tRNA、rRNA 的转录最后也要经过相应的加工和修饰过程,才具有功能。,三、基因表达,(二)翻译,以mRNA为模板指导蛋白质合成的过程(三种RNA的作用):1.mRNA携带遗传信息,作为Pr合成的模板。2.tRNA转运活化的aa并识别mRNA分子上的遗传密码。3.rRNA与Pr结合形成核蛋白体,作为Pr合成的场所,把各种特定的aa连接成多肽链。,三、基因表达,(三)RNA编辑及其意义,1.RNA编辑(RNA editing)(1)U的加入或删除;(2)CU,AG或GA的RNA碱基转换;(3)CG,GC或UA的碱基颠换。2.RNA编辑的生物学意义(1)经编辑的mRNA具有翻译活性;(2)使该mRNA能被通读;(3)在一些转录物5末端造成起始密码子AUG,调节翻译活性;(4)RNA编辑与生物进化有关;(5)RNA编辑不偏离中心法则,信息源于DNA。,四、基因表达的调控,(一)转录前调控,染色质螺旋化程度与基因转录活性有关,疏松的常染色质可进行转录,异固缩的异染色质由于DNA螺旋化阻碍RNA聚合酶作用而抑制了转录,也就是组蛋白乙酰化和DNA甲基化的关系。 染色质中的组蛋白能非特异性地非组蛋白则能特异性地解除组蛋白的抑制作用而开始转录。,四、基因表达的调控,(二)转录水平调控,1.顺式作用元件和转录因子 顺式作用元件:是指存在于基因内的那些参与转录调控的DNA序列,包括启动子、增强子等。启动子中有一些保守序列能与转录因子特异性结合;调节基因的转录,这些元件称“顺式作用元件”,功能仅限于5端侧翼序列TATA框、CAAT框。也即启动与转录因子结合才能进行转录。,四、基因表达的调控,(二)转录水平调控,2.反式作用因子(元件)和转录因子 真核细胞中的RNA聚合酶本身不能启动转录,必须有许多转录因子特异结合在基因上游的顺式作用元件;激活RNA聚合酶,从转录起始点开始合成RNA。反式作用因子:是指能够与顺式作用元件结合,参与转录调控的Pr分子。,四、基因表达的调控,(二)转录水平调控,反式作用因子又称“转录因子”,转录因子根据与DNA结合的结构域分为:(1)螺旋转角螺旋蛋白质(2)锌指蛋白(3)亮氨酸拉链蛋白(4)螺旋环螺旋蛋白 不同RNA聚合酶催化转录的RNA不一样:RNA聚合酶催化转录rRNA;RNA聚合酶催化转录mRNA;RNA聚合酶催化转录tRNA和5srRN。,四、基因表达的调控,(三)转录后调控,即hnRNA加工成成熟RNA的过程。,(四)翻译后调控,即指翻译后对多肽链的加工与修饰过程。,第五节 人类基因组计划,一、结构基因组学,(一)遗传图,(二)物理图,(三)转录图,(四)序列图,二、后基因组学,课后作业,1.基因,2.断裂基因,3.DNA复制的特点,4.基因表达的过程,