遗传与变异-人类基因组.ppt
第六章 遗传与变异人类基因组,1 人类基因组及其组成,1.1 人类基因组的DNA序列组成1.基因组及基因组学(1)基因组:遗传学名词第二版中对“基因组”的释义是指:一个单倍体细胞核中、一个细胞器(如线粒体,叶绿体)中或一个病毒毒粒中所含的全部DNA(或RNA)分子的总称。,基因组(Genome),可分为核基因组、线粒体基因组、叶绿体 基因组及病毒基因组。一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只 占整个基因组序列的很小一部分。,因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。说的更确切些,核基因组是单倍体细胞核内的 全部 DNA分子;线粒体基因组则是一个线粒体所包含的全部 DNA分子;叶绿体基因组则是一个叶绿体所包含的全部 DNA分子。,不同的生物,基因组的大小差别很大,基因组是原核细胞内构成染色体的一个DNA分子(霍乱菌有一大一小两个环状DNA分子)。而真核生物有细胞核和细胞质,染色体在细胞核内,细胞器在细胞质中。真核生物的基因组是指单倍体细胞核内整套染色体所包含的DNA分子。,而细胞器中的基因组则应区分线粒体的 基因组(动、植物均有)和叶绿体基因组(行光合作用的植物)。人类的核基因组是指单倍体细胞核中 整套染色体上(22+X+Y)所具有的全部 DNA分子。,(2)基因组学,基因组学(英文genomics)台湾译作基因体学,基因组学出现于19世纪80年代,19世纪90年代随着几个物种基因组计划的启动,基因组学取得长远发展。20世纪末基因组研究的迅猛发展而形成的 一个新的遗传学分支学科,其研究基因以及在遗传中的功能。,基因组学的分类:,基因组学是研究生物基因组和如何利用 基因的一门学问。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学和工业领域的重大问题。基因组学分成结构基因组学(structural genomics)和功能基因组学(functional genomics)。,结构基因组学和功能基因组学的概念:,结构基因组学:是研究基因和基因组的结构,各种遗传元件的组成 物质的序列特征,基因定位和基因组的作图等。功能基因组学:旨在是基因组水平上阐明DNA序列的功能,着重 研究不同的序列结构所具有的不同功能,基因的 表达与调控,基因与环境之间的相互作用等。,基因组学能为一些疾病提供新的诊断和治疗 方法。例如,对刚诊断为乳腺癌的女性,一个名为“Oncotype DX”的基因组测试,能用来评估 病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性 化医疗。基因组学还被用于食品与农业部门。,基因组学的主要工具和方法包括:,生物信息学、遗传分析、基因表达测量和基因 功能鉴定。近年来基因组学研究如雨后春笋般蓬勃兴起,该领域的研究成果已经包括599种病毒和类病毒(viroid),205种天然质粒,185种细胞器,31种 真细菌,7种古细菌,1种单细胞真核生物,2种 动物和1种植物的全基因组序列的测定。,2.人类基因组的DNA序列组成,人类基因组有总长约3.2109bp的DNA,只有3.43.5万个基因,涵盖编码各种蛋白,也包括 编码tRNA和rRNA的基因。基因内存在大量的非编码序列,如内元和调节 序列(如启动子区)等。,人类基因组拥有数量巨大的基因外DNA,约占总数的80%90%。主要包括各种类型的重复序列,如卫星 DNA,小卫星DNA和微卫星DNA等等。,1.2 人类基因组各组成成分的基本特征1.基因(Gene,Mendelian factor),是指携带有遗传信息的DNA或RNA序列,也称为遗传因子,是控制生物性状的基本遗传单位,在染色体上呈线性排列。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。,2.基因外DNA,大多数基因外DNA序列(70%80%)是以单一 或低拷贝数的形式存在的,其余(20%30%)是 中度或高度重复序列。重复序列(repetitive sequence)是指在基因组中 重复出现的DNA序列。人类基因组中有大量的重复序列。,高度重复序列:重复几百万次,一般是少于10个核苷酸残基组成的短片段。如异染色质上的卫星DNA。它们是不翻译的DNA片段。在小鼠中约占基因组的10。中度重复序列:重复次数为几十次到几千次。在小鼠中约占20。如rRNA基因、tRNA基因和某些蛋白质(如组蛋白、肌动蛋白、角蛋白等)的基因。,重复序列分成两大类,根据重复序列在基因组中的组织形式,分为分散重复序列(dispersed repetitive sequence)和串联重复序列(tandem repetitive sequence)两类。单一序列是在整个基因组里只出现一次或少数 几次的DNA序列,基因序列多半是单一序列,但有些基因在基因组内的拷贝数也不止一个,同时基因序列也有单一序列。,单一序列在小鼠中约占基因组的70。如珠蛋白基因、卵清蛋白基因、丝心蛋白基因。实验证明,所有真核生物染色体可能均含 重复序列而原核生物一般只含单一序列。高度和中度重复序列的含量随真核生物 物种的不同而变化。,3.分散重复序列,这些DNA 序列一般属于中度重复序列,以散在的 方式分布于基因组中。依重复单位的长度又分为长分散重复序列(LINE)和短分散重复序列(SINE)。人类基因组中最典型的SINE 的代表是Alu家族,由于这种DNA序列中有限制酶Alu的识别序列ACCT,故称为Alu重复序列。,Alu家族的结构和功能,Alu家族是人类基因组中含量最丰富的中度重复 序列,在整个人类基因组中散布有100万份拷贝,平均每46kb就有一个Alu序列,每个序列的平均 长度为282bp。Alu重复序列较集中在染色体的基因转录最活跃的区段。其功能可能与转录调节及DNA复制的起始有关。,LINE的结构和功能,LINE有更长的序列,重复单元的长度在1000bp 以上,在人类基因组中有上万份拷贝。LINE 是一类反转录元件(或称因子),这些序列 在人类基因组中通过转座(transposition)而移动 位置。人类基因组中著名的LINE是LINE-1(L1)。,4.簇状重复序列,人类基因组中有广泛的区域含有首尾相连成长串联状的重复序列。这些序列称为串联重复序列或称簇状重复序列。根据重复单元的大小或重复序列簇的长度,分为 卫星DNA、小卫星DNA和微卫星DNA3种。卫星DNA是一类重复单元很大的高度重复序列,其长度为1005000bp。一般分布在染色体的异染色质区(端粒、着丝粒)。,小卫星DNA的长度通常在970kb之间。重复单元的数目(n)为几个至几百个。主要存在于染色体末端靠近端粒的区域。由于同一物种不同个体间,在给定的基因座上,重复数目是可变的,所以小卫星DNA串联重复又称数目可变串联重复。微卫星DNA分布于染色体的任何区域,由1-4个核苷酸的单元重复串联而成,可长达几十个碱基对地几百个碱基对,在基因的间隔区和内元等非编码区内广泛存在。,在人类基因组中至少有3万个微卫星序列基因座。基因组中两个核苷酸的重复(如CA重复)非常普遍,平均每3060kb就存在一个这类重复序列,其重复 次数(n)大约为1560。这类短序列的微卫星DNA又称短串联重复(short tandem repeat,STR)。,2 人类遗传性疾病,人类遗传性疾病human genetic diseases 是指遗传物质发生改变或者由致病基因所控制的疾病,通常具有垂直传递和终身性的特征。遗传病具有由亲代向后代传递的特点。这种传递不仅是指疾病的传递,最根本的是指致病基因的传递。所以,发病表现出一定的家族性。父母的生殖细胞(精子或卵细胞)里携带的致病基 因,通过生殖传给子女并引起发病,而且这些子女结婚后还可能把致病基因传给下一代。,2.1 染色体病chromosome disease,由于染色体的数目或形态、结构异常引起的遗传性疾病。迄今已知的染色体病约300余种。染色体病的典型实例是第5号染色体缺失导致的“猫叫综合征”(cri du chat,“cat-cry”)。患有“猫叫综合征”的新生儿,表现出智力迟缓,头小,耳位低,眉间宽,眼裂外斜,通贯手,哭声像小猫的咪呜咪呜叫。患者往往在幼年或童年早期死亡。,染色体病的种类和临床表现,常染色体病由常染色体异常引起,临床表现先天性智力低下、发育滞后及多发畸形。如“猫叫综合征”和21三体。性染色体病由性染色体异常引起,临床表现性发育不全、智力低下、多发畸形等。如原发性小睾丸症、卵巢退化症、XXY、多Y男人(XYY、XXYY)、多X女人(XXXY、XXXXY、XXX)和XO、性染色体嵌合体如46(XX)/47(XXY)嵌合体和46(XY)/45(X)嵌合体等。,唐氏综合征,21三体综合征,又称先天性愚型或唐氏综合征(Downs synrome)是人类21条染色体在减数分裂时发生不分离,那么一半配子会携带一条多余的21号染色体。当这些带有一条多余的21号染色体的配子与正常的配子结合时,21三体就产生了。发病率为1/600-1/800,不会生育。,Klinefeler综合征,男性携带一条多余的X染色体(XXY),发病率为 1/1000-1/2000。多数患Klinefeler综合征,外貌男性,具有男性 性器官,但是睾丸异常缩小并且导致不育,身长 比一般男性高。这种综合征伴有乳房增大和其他女性身体的轮廓,患者智力往往正常。携带超过一条多余的性染色体的个体也会患Klinefeler综合征,如XXYY、XXXY、XXXXY。,Turner综合征,具有一条多余的X染色体的女性称为“超雌”(XXX),表现正常但生殖力有问题。缺少一条X染色体的女性(XO)不育,因为卵巢完全缺失,原发性闭经,她们成年后性器官仍未成熟。这些女性患有Turner综合征,她们身材矮小,不能发育第二性征。发病率为1/3500。,性染色体的影响,多一条或少一条性染色体,常使性腺发育不全,失去生育能力。少一条性染色体的影响比多一条性染色体的影响要大。XO个体远比XXY少见。Y染色体有强烈(特殊)的男性化作用。有Y染色体存在,性别分化趋向男性,体内出现睾丸等男性器官,外貌像男性(因为Y染色体上存在决定雄性睾丸的发育基因,能产生H-Y抗原)。而没有Y染色体存在时,性别分化趋向女性,体内出现卵巢,外貌像女性,不能产生H-Y抗原。,2.2 单基因病(monogenic disorder):,主要与一对致病基因有关,它们按简单的孟德尔方式遗传。至今已知有6000多种遗传性疾病是由单基因显性或隐性突变引起的。人类的体细胞核中染色体是成对的,其染色体上的基因也是成对的。如果一种遗传病的发病涉及一对基因,这对基因就成为主基因,它所导致的疾病就成为单基因病。,突变基因可在常染色体上或性染色体上,根据致病基因所在的染色体和显、隐性关系,可有6种遗传方式:常染色体显性遗传,常染色体 隐性遗传,X连锁显性遗传,X连锁隐性遗传和 Y连锁遗传及线粒体病。线粒体病:致病基因在细胞质中,只有母系(母亲)遗传。,1.隐性遗传病,(1)常染色体隐性遗传病:已发现千余种,如白化病、苯丙酮尿症、黑尿症、先天性聋哑、镰刀型细胞贫血症、半乳糖血症和呆小症等。(2)X连锁隐性遗传病:已发现两百余种,如红绿色盲、血友病、肛门闭锁症、血鳞癣症、进行性肌肉营养不良等。,2.显性遗传病,(1)常染色体显性遗传病:已发现1000多种,如多发性结肠息肉、软骨成骨发育不全侏儒症、享氏舞蹈症、秃头、并指、多指(趾)、偏头痛症等。(2)X连锁显性遗传病:目前只发现十余种,如遗传性肾炎、钟摆型眼球震颤症、抗维生素D佝偻症等。,3.X连锁遗传病,包括X连锁显性遗传病和X连锁隐性遗传病。血友病X连锁遗传病的特点:只有XX同时有致病基因才表现患病,男性 只要X染色体上有致病基因就表现患病。因此,社会调查表明伴性遗传病总是男性多于女性患者。X连锁伴性遗传病是由男性通过他的女儿传给 他的外孙,是交叉遗传。,Y连锁遗传病的特点:,基因位于性染色体上,遗传总是和性别相关联的,叫做伴性遗传。包括X连锁显性遗传病和X连锁隐性遗传病及Y连锁遗传病。Y连锁遗传病,全雄遗传病,限雄遗传病,如外耳道多毛症(毛耳:耳廓上长出浓密而硬的长毛)、刺猬皮症等。致病基因随Y染色体而传递,由父传子,子传孙,女性不会患此病。,2.3 多基因遗传病,多基因遗传病(polygenic disease)是由许多对基因 共同控制的。是由遗传因素和环境因素共同作用而呈现的性状变异。如哮喘、糖尿病、原发性高血压、先天性心脏病、先天性畸形足、先天畸形(唇裂、腭裂)、肿瘤、心血管病、精神分裂症(神经-精神类疾病)、代谢性疾病、免疫性疾病、无脑儿等常见病。,多基因遗传病的特点:,(1)有家族聚集现象,在患者亲属发病率较高,在一般群体中发病率较低,大约只在1%10%之间。(2)病症表现程度是多基因作用效应的累积,单个基因作用效应是微弱的,易受环境因素影响。在同类患者之间存在有许多中间类型,如农作物的高度、产量等。(3)生过患儿的夫妇,其后代再生孩子,则复发危险率增高。因为他们带有相当多的致病基因,以脊椎裂为例,生了一个病儿后复发危险率为4%,生了两个病儿后复发危险率为10%。,优生和优生学,优生是1883年由人类学家高尔顿(Galton)首先提 出来的,主张通过选择性婚配减少不良遗传素质。优生学(eugenics)是应用医学遗传学的原理来研究改善人类遗传素质的一门科学。专门研究使一个民族未来的遗传素质在肉体和精神两方面向前进或衰退的社会因素的学科。研究如何改良人的遗传素质,产生优秀后代的学科。主要措施涉及各种影响婚姻和生育的社会因素,如宗教法律、经济政策、道德观念、婚姻制度等。,3 癌基因与恶性肿瘤,肿瘤(tumor)是一类疾病的总称,其基本特征是正常的细胞增殖与凋亡失控,扩张性增生的细胞群形成肿块。其中的一类恶性肿瘤(malignant tumor)就是我们通常所指的癌症(cancer),它区别于良性肿瘤的重要特性是一群能侵袭周围组织和器官的癌细胞有远端转移能力,破坏受侵染的脏器,最终使机体衰亡。,肿瘤分为良性肿瘤和恶性肿瘤,一般所说的癌 即指恶性肿瘤而言。恶性肿瘤从组织学上分为上皮性癌和非上皮性的 肉瘤及血液癌。良性和恶性的区别常根据临床的预后加以判定。两者的鉴别常常很难有严格的区别。,良性肿瘤和恶性肿瘤的区别,良性肿瘤和恶性肿瘤由各个肿瘤细胞所处的环境条件来决定。有的学者主张良性肿瘤和恶性肿瘤之间是存在着连续的阶段,可是有的良性肿瘤例如前列腺腺瘤、乳腺纤维腺瘤、子宫肌瘤、血管球瘤等是和内分泌、神经等机体调节机制有密切关系的组织增生,因而有的学者主张它和恶性肿瘤有本质上的区别。恶性肿瘤对人类健康和生命的威胁很大,它和心血管疾患已经成为医学上的两大难关,是疾病导致死亡原因的头两位。,3 癌基因与恶性肿瘤3.1 原癌基因与抑癌基因,1.病毒癌基因和原癌基因病毒癌基因:存在于病毒(大多是逆转录病毒)基因组中能使 靶细胞发生恶性转化的基因。它不编码病毒结构成分,对病毒无复制作用,但是当受到外界的条件激活时可产生诱导肿瘤发生的作用。,原癌基因(oncogene),是细胞内与细胞增殖相关的基因,是维持机体 正常生命活动所必须的,在进化上高等保守。当原癌基因的结构或调控区发生变异,基因 产物增多或活性增强时,使细胞过度增殖,从而形成肿瘤。肿瘤细胞中存在着显形作用的癌基因,在正常 细胞中有与之同源的正常基因,被称为原癌基因。,原癌基因表达的特点:,(1)正常细胞中原癌基因的表达水平一般较低,而且是受生长调节的,其表达主要有三个特点:具有分化阶段特异性;细胞类型特异性;细胞周期特异性。(2)肿瘤细胞中原癌基因的表达有2个比较普遍 突出的特点:,原癌基因表达的特点:,(2)肿瘤细胞中原癌基因的表达有2个比较普遍 突出的特点:一些原癌基因具有高水平的表达成过度表达原癌基因的表达程度和次序发生紊乱,不再 具有细胞周期特异性。(3)细胞分化与原癌基因表达 在分化过程中,与分化有关的原癌基因表达 增加,而与细胞增殖有关的原癌基因表达受抑制。,2.抑癌基因,抑癌基因也称为抗癌基因。早在1960年,有人将癌细胞与同种正常成纤维细胞融合,所获杂种细胞的后代只要保留某些正常亲本染色体时就可表现为正常表型,但是随着染色体的丢失又可重新出现恶变细胞。这一现象表明,正常染色体内可能存在某些抑制肿瘤发生的基因,它们的丢失、突变或失去功能,使激活的癌基因发挥作用而致癌。,3.2 癌症的遗传学基础,1.基因突变(gene mutation)是一个基因内部可以遗传的结构的改变。又称为点突变,通常可引起一定的表型变化。广义的突变包括染色体畸变。狭义的突变专指点突变。实际上畸变和点突变的界限并不明确,特别是微细的畸变更是如此。野生型基因通过突变成为突变型基因。突变型一词既指突变基因,也指具有这一突变基因的个体。,基因突变的特性,随机性:指基因突变的发生在时间上、在发生这一个突变的个体上、在发生突变的基因上都是随机的。在高等植物中所发现的无数突变都说明基因突变的随机性。在细菌中则情况远为复杂。可逆性:突变基因又可以通过突变而成为野生型基因,这一过程称为回复突变。,基因突变的特性,正向突变率总是高于回复突变,一个突变基因内部只有一个位置上的结构改变,才能使它恢复原状。稀有性:突变是极为稀有的,野生型基因以极低的突变率发生突变。少利多害性:一般基因突变会产生不利的影响,被淘汰或死亡,但有极少数会使物种增强适应性。,2.多次遗传改变的致癌作用,致癌作用(carcinogenesis)是指环境有害因素引起或增进正常细胞发生恶性 转化并发展成为肿瘤的过程。化学致癌(chemical carcinogenesis)是指化学物质引起或增进正常细胞发生恶性转化 并发展成为肿瘤的过程。,3.3 改变生活方式能降低癌症的危险性,具有这类作用的化学物质称为化学致癌物(chemical carci-nogen)。在毒理学中,“癌”的概念广泛,包括上皮的恶性病变(癌),也包括间质的恶性病变(肉瘤)及良性肿瘤。这是因为迄今为止尚未发现只诱发良性肿瘤的致癌物,而且良性肿瘤有恶变的可能。,4 人类基因组计划4.1 什么是人类基因组计划,人类基因组计划(human genome project,HGP)是美国科学家沃森等先提出了测定人类基因组 全序列的建议,是在1985年5月,能源部在美国 加利福尼亚州的圣克鲁兹召开的一次会议上,第一次认真讨论这个建议,由此形成了美国能源 部的“人类基因组计划”草案。于1990年10月1日正式启动的。,美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一价值达30亿 美元的人类基因组计划。这一计划旨在为30多亿个碱基对构成的人类 基因组精确测序,发现所有人类基因并搞清其 在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。,“人类基因组计划”分为两个阶段:,具有DNA序列图以前的计划和DNA序列图计划。DNA序列图以前的计划包括物理图、转录图、遗传图。DNA序列图计划包括序列图、基因图。结构基因组学时代正向功能基因组学时代过渡,新时代的最终目的是阐明基因组所表达的真正执行生命活动的全部蛋白质的表达规律和生物功能。,“人类基因组计划”,是解读人类的基因组上的所有基因,分析24条 染色体DNA分子中的四种碱基对。30亿个碱基对是一个很长的序列,为了更好地 搞清这个长序列,需要有其他辅助工作配合。1994年完成了具有5826个动态性标志,分辨率 高达0.7cM的遗传图谱。1998年成立的美国Celera公司宣布将用“全基因组鸟枪法”策略在3年内测定人类基因组全序列。,“人类基因组计划”,经过全球16个中心的科学家的共同努力,终于 实现了既定目标,而Celera公司也取得了重大 进展,最终双方达成协议,于2000年6月26日 共同宣布了工作框架图的成果。科学家发现人类基因数目大约为3.4万至3.5万个,仅比果蝇多2万个,远少于原先10万基因的估计。2004年4月14日中午在华盛顿宣布,人类基因组序列图绘制成功。所有目标全部实现的时间,“人类基因组计划”的意义,人类基因组计划(简称HGP)经过10年的研究,已取得巨大成果。其中包括在四张图谱上:遗传图谱、物理图谱、转录图谱和序列图谱。人类基因组计划是继曼哈顿原子弹计划、阿波罗登月计划之后科学史上的第三大科学计划。与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。,4.2 人类基因组计划内容,1.绘制人类基因连锁图 遗传图谱又称连锁图谱(linkage map),它是以具有遗传多态性的遗传标记为“路标”,以遗传学离为图距的基因组图。遗传多态性是在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%。,遗传学距离在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM。遗传图谱的建立为基因识别和完成基因定位创造了条件。但是现在所知的具多态性的性状不多,等位基因的数量有限,信息量不足。这样就限制了人类基因组的遗传分析工作。所幸的是,DNA重组技术的建立提供了新一代的遗传达室标记。,遗传图谱的意义,6000多个遗传标记已经能够把人的基因组分成 6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。,2.绘制物理图,物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。是一个“物理标记”作为标路,以Mb,kb,bp等作为图距的基因组图单位。物理图谱与遗传图谱相互参照,可以把遗传学的信息转化为物理信息。,DNA物理图谱是指DNA链的限制性酶切片段的 排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。,DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。,制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法第三代标记,第三代标记是称作单核苷酸多态性标记(single nucleotide polymorphsm SNP)的遗传标记系统。人类群体有很大的遗传多样性,而在大多数基因位点上都会有若干个等位型(alleles),对每一个核苷酸来说,在任何一代人群中大约每1x109个个体就会发生一次变异。由这种方式产生的单碱基变异就形成许多双等位型标记。这种标记在人类基因组中可达到300万个,平均每1000个碱基对就有一个双等位型标记。,双等位型标记的意义,因此,34个相邻的这种标记构成的单倍型(haplotype)就可以有816种,相当于一个微卫星标记形成的多态性。这种标记数目多,覆盖密度大,它的开发和应用摒弃了遗传标记分析技术的“瓶颈”凝胶电泳,为DNA芯片技术应用于遗传作图提供了基础。物理图谱还有更重要的作用,有了前面标志的序列位置,就可以将克隆的DNA片段,一个一个接起来。,中国人类基因组计划,据中国人类基因组计划负责人杨焕明教授说:“如果两个克隆的DNA 片段,都含有某一路标的序列,就说明这两个片段的一部分是重叠的。我们整个基因组的DNA就是由这些相互重叠的DNA片段全部覆盖。换言之,这些DNA片段,就是我们人类基因组这一区域的代表,这些片段的克隆就是我们研究这一区域的实验材料。”,3.人类基因组测序(sequencing),序列图谱是指通过测序得到基因组的序列图谱。序列图谱的概念太简单。随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。,3.序列图谱,可以说序列图谱是人类基因组在分子水平上最高层次,最为详尽的物理图谱。测定总长为1米,由30亿对核苷酸组成的基因组全部DNA序列,是基因组计划中最为明确,最为艰巨的定时、定量、定质的新任务。人类3.43.5万个基因的信息以及相应的染色体位置已经被阐明,序列图谱已经成功。通过测序得到基因组的序列图谱。,基因图谱,基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。我们知道生物性状是由结构或功能蛋白决定的,功能蛋白是由mRNA编码的,mRNA又是由编码蛋白质的功能基因转录而来的。,基因图谱的原理,在人类基因组中鉴别出占具2%5%长度的全部 基因的位置、结构与功能,最主要的方法是通过 基因的表达产物mRNA反追到染色体的位置。所有生物的性状和疾病都是由结构蛋白质或功能 蛋白质决定的,而已知的所有蛋白质都是由mRNA编码的,这样可以把mRNA通过反转录酶合成cDNA或称作表达序列标签(EST)的部分的cDNA片段。,表达序列标签(EST),也可根据mRNA的信息人工合成cDNA或cDNA 片段,然后再用这种稳定的cDNA或EST作为“探针”进行分子杂交,鉴别出与转录有关的 基因。用PolyA互补的寡聚T或克隆载体的相关序列作为引物对mRNA双端尾侧的几百个bp进行测序得到EST(表达序列标签)。,4.其他物种基因组的分析,人类基因组计划(HGP)还包括对大肠杆菌和其他 细菌、酵母菌、线虫、拟南芥、黑腹果蝇及 小白鼠等物种的基因组的比较分析,帮助我们 解读人类的百科全书,以便更好地了解我们 自己的基因。,4.3 基因组研究成果,1.HGP对人类疾病基因的研究贡献人类疾病相关的基因是人类基因组中结构和功能 完整性至关重要的信息。人类现在有2035类18000种疾病,都直接或间接与基因有关。可分为三大类:单基因病、多基因病、获得性基因病。,单基因病的发现过程,对于单基因病,采用“定位克隆”和“定位候选 克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了 基础。对于心血管疾病、肿瘤、糖尿病、神经-精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。,获得性基因病由病原微生物通过感染将其基因入侵到宿主基因引起。现代科学已证明:基因健康,细胞活泼,则人体健康;基因受损,细胞变异,则人患疾病。因此,疾病基因的定位,克隆和鉴定,是HGP各种竞争中居于核心部分,也是HGP启动以来在社会上显示度最大的成就。健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”和“环境基因组学计划”。,2.HGP对医学的贡献,就其对医学的影响来说,人类基因组图谱的确定将大大加速人们对疾病基因的鉴定,利用人类基因组图谱和顺序,我们可以对正常人和患者的DNA进行有效的分析比较,大大加快寻找特定疾病的基因工作。基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病的预防、疾病易感基因的 识别、风险人群生活方式、环境因子的干预。,基因治疗的概念,基因图谱的最大最直接用途当属医疗诊断,特别 像许多癌症和心脏病等源于遗传基因变异的疾病。基因治疗是指将遗传物质导入载体或受体细胞,通过替代缺陷基因,修正错误基因,结识异常的 基因,调节基因产物的表达方式以实现治疗疾病 为目的的一种治疗方法。,基因治疗,人们可以根据引起疾病的基因缺陷,通过定向 纠正,替换那些错误的基因,达到治病的目的。当然,基因治疗真正走上临床还有待时日。发现和开发新的蛋白质和多肽类药物,目前市场上和正在开发的基因工程药物仅几百种,而人类有基因3.43.5万个。在这些新药基因中,还有许多可被开发和生产新的蛋白质多肽药物。,3.HGP对生物进化研究的影响,人类基因组序列的测定具有重大的科学价值。人类基因组的破译和解读将会导致新的生物学 革命。首先,该计划的实施将极大地促进生命科学领域一系列基础研究的发展,阐明基因的结构与功能关系,细胞的发育、生长、分化的分子机理,疾病发生的机理等。,垃圾DNA有没有用?,在人类和其他生物的染色体中,只有很少一部分DNA片断是可以表达为性状的基因,大部分DNA片断并不表达,因此称为冗余DNA或垃圾DNA。这些片断真的没有功能吗?可能并不都是如此。研究发现,一些片断也许对细胞分裂前染色体复制和确保染色体组正确地分配到两个子细胞来说是必不可少的,还为进化提供原材料,但大部分这些片断的性质和行使功能的机制仍鲜为人知。,人类基因组的研究,随着人类基因组的工作框图的确定和解读,这些片断的功能和起作用的机理将逐步得到阐明。随着人类基因组的工作框图的确定和解读,细胞的发育、生长、分化的分子机理和疾病发生的机理等也将随之得到阐明。其次,人类基因组的研究将有利于对生物是如何进化的理解。,人类多数基因的起源,所有生物都是历史上的生物进化来的。这种进化不仅表现在生物的表型上,而且表现在生物的基因型中。我们人类的基因组就记录着我们人类的进化史。如果我们知道了人类和其他生物其因的全序列,就可以追溯出人类多数基因的起源。,哺乳动物之间的蛋白质差异,现在人们已知道,所有哺乳动物都有着相似的蛋白质谱,哺乳动物之间的差异主要在于受控基因的表达时间和水平,及细胞类型专一的调控信号方面。人胚胎的有序发育需要特定的基因群在特定的场所和时间的活化,使多潜能细胞成为新类型的细胞,这一过程部分地受控于位于基因附近的调控顺序。,哺乳动物之间的蛋白质差异,这些顺序在其活化的基因中大多是同源的。对人类基因组进行序列分析,并将其与其他哺乳 动物,比如小鼠的基因组序列进行比较,将使 我们能确定出大量的调节顺序。这不仅能使我们理解基因调控的规律,而且能使 我们理解人从其它哺乳动物进化出来的过程中所 发生的变化。,4.人类基因组计划的进展与未来,国际HGP 研究的飞速发展和日趋激烈的基因抢夺战已引起了中国政府和科学界的高度重视。在政府的资助和一批高水平的生命科学家的带领 下,我国已建成了一批实力较强的国家级生命 科学重点实验室,组建了北京和上海人类基因组 研究中心。,中国的HGP研究的进展,有了研究人类基因组的条件和基础,并引进和 建立了一批基因组研究中的新技术。中国的HGP在多民族基因保存、基因组多样性的比较研究方面取得了令人满意的成果,同时在白血病、食管癌、肝癌、鼻咽癌等易感基因研究方面亦取得了较大进展。,人类基因组计划给医学带来了新的模式,人类基因组计划对未来人类健康的最大意义莫过于给21世纪医学带来了新的模式。首先是医学带来的变化,不是一般的描述症状,而是在本质上、在分子水平上、在遗传信息上找到对疾病易感性的依据。如对于非典型性肺炎(SARS),你得先有诊断依据。现在由于人类基因组能识别基因,使得我们的证据不仅仅是对疾病表现的描述,而且能深入到分子水平。,人类基因组计划给医学带来了新的模式,其次,人们利用基因可以改良果蔬品种,提高农作物的品质,更多的转基因植物和转基因动物、转基因食品将问世,人类可能在新世纪里培育出超级作物。通过控制人体的生化特性,人类将能够恢复或 修复人体细胞和器官的功能,甚至改变人类的 进化过程。,潜伏着新的危险和面临着新的困境,人类基因组计划发展突飞猛进,但是人类基因组潜伏着新的危险和面临着新的困境。人类基因组研究从一开始就与许多伦理问题纠缠在一起。例如,在遗传学家取血样作DNA分析前要不要向提供DNA样品的人讲清楚为什么,并取得他的知情同意?修改人类胚胎!,潜伏着新的危险,同时在21世纪的生老病死的人工安排(基因干预、辅助生殖、生命维持技术)将在更大程度上代替 自然安排,人体结构、心理、行为将在更大程度上受到人工改变(如药物、脑芯片、脑移植、基因操纵)。在这种情况下利用生命科技的发展侵犯人权的可能性和机会也就更大更多。,面临着新的困境,个人隐私被侵犯,个人的自主权或自我决定权受到侵犯,人被当作“客体”或“东西”对待的可能性增加,即人易被“客体化”。所以,当人们为人类基因组研究取得可喜进展而 欢呼的同时,应冷静地思考一下它可能在社会、法律、伦理方面产生的负面效应。,遗传学名词第二版对“基因组”的释义:单倍体细胞核、细胞器或病毒粒子所含的全部DNA分子或RNA分子。,原癌基因表达的特点:l、正常细胞中原癌基因的表达水平一般较低,而且是受生长调节,其表达主要有三个特点:具有分化阶段特异性;细胞类型特异性;细胞周期特异性。2、肿瘤细胞中原癌基因的表达有2个比较普遍和突出的特点:一些原癌基因具有高水平的成过度表达。原癌基因的表达程度和次序发生紊乱,不再具有细胞周期特异性。3、细胞分化与原癌基因表达在分化过程中,与分化有关的原癌基因表达增加,而与细胞增殖有关的原癌基因表达受抑制。,END,