基因组学课件遗传作图物理图.ppt
基本概念,基因组(Genome):一个生物体、细胞器或病毒的整套基因和染色体组成,即全部基因的总称(包括所有的编码区和非编码区) 基因组学(Genomics):以基因组分析为手段,对所有基因进行基因组作图、核苷酸序列分析、基因定位、时序表达模式和基因功能分析的一门科学。分子遗传学的分支学科提供有关生物物种及其细胞功能的进化信息生命科学的前沿和热点领域,中英联合实验室,基本概念基因组(Genome):一个生物体、细胞器或病毒的整,基因组学,最早1986年,由美国霍普金斯大学著名人类遗传学家和内科教授McKusick(1921-2008)提出来的随着人类基因组计划的实施,基因组学逐渐成为一门以结构基因组学为主的高度综合和跨学科的科学功能基因组学、比较基因组学、环境基因组学、药物基因组学等都纷纷出台。,中英联合实验室,基因组学最早1986年,由美国霍普金斯大学著名人类遗传学家和,什么是基因组?,一个物种中所有基因的整体组成。人类基因组的两层意义:遗传信息和遗传物质。揭开生命的奥秘,需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。,中英联合实验室,基因组研究内容,基因表达研究,即比较不同组织和不同发育阶段、正常状态与疾病状态,以及体外培养的细胞中基因表达模式的差异。基因产物-蛋白质功能研究,包括单个基因的蛋白质体外表达方法。蛋白质-蛋白质功能研究。,中英联合实验室,基因组研究内容基因表达研,基因组学的分类,分类:结构基因组学(Structural Genomics) 比较基因组学(Comparative Genomics) 功能基因组学(Functional Genomics) 药物基因组学(Medical Genomics) 营养基因组学(Nutritional Genomics) 生物信息学(Bioinformatics) 蛋白质组学(Proteomics),中英联合实验室,基因组学的分类分类:中英联合实验室,基本概念,结构基因组学:通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。将基因组分解成小的易操作的结构区域,构建高分辨率的遗传图、物理图、转录本图,一个生物体基因组的最终图就是它的全部DNA序列 。人类基因组计划果蝇基因组拟南芥菜基因组,中英联合实验室,基本概念结构基因组学:中英联合实验室,基本概念,遗传连锁图:通过遗传重组所得到的基因线性排列图称为遗传连锁图。通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离。 物理图谱:是利用限制性内切酶将染色体切成数个片段,根据重叠序列把片段连接成染色体,确定遗传标志之间物理距离碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。转录本图谱:由基因转录本mRNA反转录建立cDNA文库,通过cDNA克隆测序得到基因组的表达序列图谱。,中英联合实验室,基本概念遗传连锁图:通过遗传重组所得到的基因线性排列图称为遗,基本概念,比较基因组学:在基因组图谱和测序基础之上,对已知的基因和基因组结构进行比较,了解基因的功能、表达机理和物种的进化的学科。比较分析7种生物的基因组,结果表明:在进化上,古细菌、真菌和真核生物有一个共同的具有自养能力的最近祖先。,中英联合实验室,基本概念比较基因组学:中英联合实验室,基本概念,功能基因组学后基因组学(Post genomics),利用结构基因组学提供的信息和产物,通过在基因组系统水平上全面分析基因的功能。基因功能发现、基因表达分析、突变检测、基因组的表达与调控研究。单一基因-蛋白质 基因组-蛋白质组,系统研究。对成千上万的基因表达进行分析和比较,从基因组整体水平上对基因的活动规律进行阐述。一个细胞的转录表达水平能够精确特异地反映类型、发育阶段以及状态。,中英联合实验室,基本概念功能基因组学中英联合实验室,中英联合实验室,中英联合实验室,基本概念,药物基因组学:根据不同个体间的基因组差异与基因多态性,阐明个体间在药物代谢和效应方面发生差别的遗传基础。不同的个体间药物的疗效和副作用存在差异。促使新药的发现。根据个体的遗传背景来优化药物治疗方案,即“个体化治疗”。,中英联合实验室,基本概念药物基因组学:中英联合实验室,基本概念,营养基因组学:研究对人类营养有重要作用的植物次级代谢途径的相关基因。与铁吸收转运有关的基因与生物素、维生素B1和维生素E合成有关酶的基因,中英联合实验室,基本概念营养基因组学:中英联合实验室,基本概念,生物信息学:以计算机为工具,用数学和信息科学的观点、理论和方法去研究生命现象,对生物信息进行储存、检索和分析的科学。以基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言发现新的基因和新的功能 ,进行蛋白质空间结构模拟和预测。认识生命的起源、进化、遗传和发育的本质。揭示人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供合理有效的方法。依据特定蛋白质的功能进行必要的药物设计,中英联合实验室,基本概念生物信息学:中英联合实验室,基本概念,蛋白质组学:蛋白质组(Proteome):在一种细胞内存在的全部蛋白质。蛋白质组学:研究细胞内所有蛋白质及其动态变化规律的科学。功能蛋白质组(Functional Proteome):在特定时间、特定环境和实验条件下基因组活跃表达的蛋白质。功能蛋白质组是总蛋白质组的一部分。蛋白质组和功能蛋白质组是生命科学的新的研究内容。,中英联合实验室,基本概念蛋白质组学:中英联合实验室,基因组计划,模式微生物基因组计划模式植物基因组计划模式动物基因组计划人类基因组计划,中英联合实验室,基因组计划模式微生物基因组计划中英联合实验室,基因组计划 ?获得全基因组序列:为基因组的全面测序提供工作框架构建基因组图:在长链DNA分子上寻找特征性标记,根据分子标记将包括这些序列的克隆进行连锁定位,绘制基因组图。根据基因组图,基因组区段分解、逐个测序,最后进行组装,中英联合实验室,基因组计划 ?中英联合实验室,重叠群法:contig,指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。由上至下。直接鸟枪法:首先进行全基因组鸟枪法测序,再以基因组图的分子标记为起点,将鸟枪法DNA片段进行组装。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生的序列误排。由下至上,中英联合实验室,重叠群法:contig,指相互间存在重叠顺序的一组克隆。根据,中英联合实验室,中英联合实验室,基因组作图的方法,遗传作图物理作图序列作图基因作图,中英联合实验室,基因组作图的方法遗传作图中英联合实验室,基因组学(genomes),基因组图遗传作图(genetic mapping):采用遗传学分析方法(杂交实验和家系分析),将基因或其他DNA顺序标定在染色体上,构建连锁图。遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。物理作图( phisical mapping ):采用分子生物学技术,直接将DNA分子标记、基因或克隆标定在基因组实际位置。限制性片段作图与克隆作图的图距单位为碱基对。,中英联合实验室,基因组学(genomes)基因组图中英联合实验室,第二章 遗传作图,1.基因组作图的方法2.遗传作图中使用的标记3.遗传作图的方法,中英联合实验室,第二章 遗传作图1.基因组作图的方法中英联合实验室,2.1 基因组作图的方法,遗传图谱(genetic map)又称连锁图谱(linkage map)或遗传连锁图谱(genetic linkage map):指基因组内基因和专一的多态性DNA标记(marker)相对位置的图谱遗传作图(genetic mapping):采用遗传学分析方法将基因或其它DNA顺序标定在染色体上构建成连锁图遗传图谱表明基因之间连锁关系和相对距离,早期 绘制的经典遗传图谱的单位是重组率,1%的重组率为1个遗传单位。现代遗传图谱的单位为厘摩(centi Morgan,cM),1cM相当于1%的重组率,约为1 000 000个碱基对(base pairs,bp),中英联合实验室,2.1 基因组作图的方法遗传图谱(genetic map)又,2.1 基因组作图的方法,通过遗传图谱,我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等遗传距离是通过遗传连锁分析获得的,使用的DNA厘摩标志越多,越密集,所得到的遗传连锁图的分辨率就越高遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段,中英联合实验室,2.1 基因组作图的方法通过遗传图谱,我们可以大致了解各个基,2.2遗传作图中使用的标记,遗传标记(Genetic Markers):遗传图有特征性的位置标记,用于表示基因组中特定顺序所在的位置。这些标记按孟德尔方式遗传,标记位点应是多态的基因标记DNA标记,中英联合实验室,2.2遗传作图中使用的标记遗传标记(Genetic Mark,2.2.1 基因标记,表型(phenotype) :一个遗传性状必须以两种替换形式或表型存在才能用于遗传学分析等位基因(allele):每种表型是由不同的等位基因控制肉眼分辨的表型:颜色、形状等。如用于果蝇遗传图的构建生化表型:微生物遗传学研究,中英联合实验室,2.2.1 基因标记表型(phenotype) :一个遗传性,2.2.1 基因标记,人类的生化性状ABO血型HLA(人类白细胞抗原)复等位基因(multiple alleles):人类白细胞抗原(HLA)是最复杂最具多态性的体系,位于6 号染色体HLA-DRBI(human leukocyte antigens-DRBI)基因位点至少有59个等位基因HLA-B抗原编码位点有60多个等位基因,中英联合实验室,2.2.1 基因标记人类的生化性状中英联合实验室,ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因其特异性决定了血型的差别,中英联合实验室,ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因中英联,2.2.2 DNA(分子)标记,基因标记:有用、有效,并非理想。高等生物,可用作标记的基因十分有限许多性状都涉及多基因。高等生物基因组中存在大量的基因间隔区,用基因标记将在遗传图中留下大片的无标记区段。并非所有等位基因可以通过常规实验予以区分,因而是产生的遗传图不完整,必须寻找其他更有效的标记,中英联合实验室,2.2.2 DNA(分子)标记基因标记:有用、有效,并非理想,2.2.2 DNA(分子)标记,限制性片段长度多态性(restriction fragment length polymorphisms,RFLP)简单序列长度多态性(simple sequenece length polymorphisrns,SSLPs)小卫星序列:(Minisatellite DNA)微卫星序列:(Microsatellite DNA, MS)单核苷酸多态性标记(single nucleotide polymorphisms,SNP),中英联合实验室,2.2.2 DNA(分子)标记限制性片段长度多态性(rest,2.2.3 遗传作图中标记的发展,遗传标记的发展:第一代标记 经典的遗传标记(蛋白质和免疫学的标记) 70年代中后期,限制酶片段长度多态性(RFLP)第二代标记 85年,“小卫星序列(minisatellite) 89年,“微卫星序列(microsatellite)第三代标记 单核苷酸多态性标记(single nucleotide polymorphism ,SNP),中英联合实验室,2.2.3 遗传作图中标记的发展遗传标记的发展:中英联合实验,2.2.3 遗传标记中的第一代标记,经典的遗传标记(蛋白质和免疫学的标记)ABO血型位点标记HLA位点标记存在问题:已知多态的蛋白质很少等位基因的数目有限无法获得足够的信息量检测技术的繁琐等限制了人类基因组的遗传分析工作促使人们直接在DNA上寻找新的遗传标记,中英联合实验室,2.2.3 遗传标记中的第一代标记经典的遗传标记(蛋白质和免,2.2.3 遗传标记中的第一代标记,70年代发展起来的DNA重组技术、DNA克隆技术和DNA探针技术为拓展遗传图谱的构建途径创造了技术条件使人类基因定位的方法从细胞及染色体水平过渡到分子水平DNA水平的多态性标记位点作为绘制现代遗传图谱的主要界标,提高图谱的 精确度、准确性。遗传图谱的绘制进入了一个崭新的时代 现代遗传图谱的概念由Botstein D等(1980)首先提出,在此基础上,限制性片段长度多态性(RFLP)作为遗传图谱的第一代崭新标记得以问世 。限制性位点能够用作基因标记。广泛应用到基因组研究中。基因或基因组可以用重叠的限制性片段来作图。最终扩展到整个序列,构建连锁图谱,中英联合实验室,2.2.3 遗传标记中的第一代标记70年代发展起来的DNA重,同源染色体同一区段DNA 序列的差异,限制酶识别的碱基顺序有专一性,中英联合实验室,同源染色体同一区段DNA 序列的差异,中英联合实验室,2.2.3遗传标记中的第二代标记,简单序列长度多态性 SSLPs发现:小卫星序列minisatellite (1985年)微卫星序列microsatellite (1989年)microsatellite marker又称简单串连重复(short tandem repeat,STR),最重要的优点是高度多态性,提供的信息量相对很大;另外可用PCR技术使操作实现自动化,遗传图与物理图研究中非常有用的工具20世纪80年代后期,人们开始应用微卫星序列(microsatellite,MS)绘制图谱。1994年底,美、法完成了以RFLP及微卫星为标志的遗传图谱.图谱包含了5826位点,覆盖4000cM,分辨率高达0.7cM1996年法国报道了完全以微卫星DNA标志构建的遗传连锁图,包含2335位点,分辩率为1.6cM,中英联合实验室,2.2.3遗传标记中的第二代标记简单序列长度多态性 SSLP,中英联合实验室,中英联合实验室,2.2.3遗传标记中的第三代标记,单核苷酸多态性标记(single nucleotide polymorphisms,SNPs)点突变,位于密码子的摇摆位置,表现为沉默突变而被大量保留下来。大多数不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测在人类基因组中可达到300万个,平均每1000个碱基对就有一个数目多,覆盖密度大,它的开发和应用摒弃了遗传标记分析技术的瓶颈凝胶电泳,为DNA芯片技术应用于遗传作图提供了基础,中英联合实验室,2.2.3遗传标记中的第三代标记单核苷酸多态性标记(sing,中英联合实验室,中英联合实验室,2.3 遗传作图的方法,连锁分析是遗传作图的基础:1905,Bateson,Saunder和Punnett;1911年Morgan揭示了连锁分析的意义在同一条染色体上的基因间表现出遗传连锁(Genetic linkage),因为它们都是在同一条长的DNA分子上部分连锁与重组:比利时细胞学家Janssens发现减数分裂时同源染色体的交换Sturtevant:2 个彼此靠近的基因之间因交换而分离的频率,要比相互远离的2个基因之间发生分离的频率要小重组率则可成为测量基因之间相对距离的尺度,只要获得不同基因之间的重组率,就可绘制一份基因位于染色体上相对位置的地理图,中英联合实验室,2.3 遗传作图的方法连锁分析是遗传作图的基础:1905,,中英联合实验室,中英联合实验室,部分连锁与遗传作图,构建遗传图谱的基本原理真核生物遗传过程中会发生减数分裂,此过程中染色体要进行重组和交换,这种重组和交换的概率会随着染色体上任意两点间相对距离的远近而发生相应的变化。根据概率大小,人们就可以推断出同一条染色体上两点间的相对距离和位置关系。正因为如此,我们得到的这张图谱也就只能显示标记之间的相对距离。我们称这一距离(概率)为遗传距离(cM),由此构建的图谱也称为遗传图谱。,中英联合实验室,部分连锁与遗传作图构建遗传图谱的基本原理中英联合实验室,连锁遗传图的做法,一般以最左端的基因位置为0,如发现有新的基因在更左端的位置时,把0点让给新基因,其余的基因座位作相应移动重组率在0-50%之间,但图谱上出现50以上的图距。这是由于较远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校正公式为 RF=1/2(1-e-m) RF为重组率 m:平均交换数 m值说明在两个基因座之间每次减数分裂有8次交换,因每次交换只包括4条染色单体中的两条非姐妹染色体,所以由m转换成的真实图距应为1/2m,中英联合实验室,连锁遗传图的做法一般以最左端的基因位置为0,如发现有新的基因,不同模式生物的连锁分析,有性杂交实验系谱分析DNA转移,中英联合实验室,不同模式生物的连锁分析有性杂交实验中英联合实验室,杂交实验的连锁分析,选择已知基因型的亲本,设计杂交方案,获得交配的子代并分析其表型和基因型对于高等真核生物的常规连锁分析并不是直接检查配子,而是检测分别来自两个亲本配子融合形成的二倍体基因型,即进行遗传杂交两点杂交和多点杂交,中英联合实验室,杂交实验的连锁分析选择已知基因型的亲本,设计杂交方案,获得交,系谱分析,系谱分析法即对某家庭性状相关成员进行 统计,分析性状之间的连锁关系,通过重组率进行相关基因定位,这种方法又称家系分析法(pedigree method) 不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,主要涉及人类和多年生树木优势对数值(lod score)分析:lod值是基因连锁可能性的对数,用于判定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理想的情况是资料来自不同系谱,中英联合实验室,系谱分析系谱分析法即对某家庭性状相关成员进行 统计,分析性状,细菌的遗传作图,转化( transformation ):供体细胞释放的一段DNA(通常小于50kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆转导(transduction):通过噬菌体将小片段DNA从供体细胞转移到受体细胞接合转移(conjugation):两个细菌形成物理接触,DNA从供体转移到受体,中英联合实验室,细菌的遗传作图转化( transformation ):供体,细菌的遗传重组,中英联合实验室,细菌的遗传重组中英联合实验室,细菌遗传作图中采用的都是生化标记(如合成色氨酸的能力、对抗生素的敏感性等),隐性表型(如不能合成色氨酸)是可以互补的性状。基因转移在具有野生型等位基因的供体品系与具有隐性等位基因的受体品系之间进行,根据受体细胞是否获得基因指令的生化功能来监测转移的DNA是否进入受体细胞接合:根据野生型基因进入受体的时间表,可以确定基因所在的位置转导及转化:依据所研究的基因是否同时出现在受体细胞中,紧密连锁的基因总是有最高的机率被同时转移。,中英联合实验室,细菌遗传作图中采用的都是生化标记(如合成色氨酸的能力、对抗生,RFLP连锁图,RFLP是第一种用于研究的DNA标记(David Bostein,1980)基本设想:由于同源染色体同一区段DNA顺序的差异,用限制酶消化时,会得到长度各不相同的限制性片段。经过琼脂糖凝胶电泳分离,可直接显示不同个体同一位点DNA组成的差异由于限制酶的专一性,用不同的限制酶处理同一DNA样品时,可以产生与之对应的不同限制性片断,从而提供大量位点多态性信息,中英联合实验室,RFLP连锁图RFLP是第一种用于研究的DNA标记(Davi,DNA限制酶分析,中英联合实验室,DNA限制酶分析中英联合实验室,亲本:A1/B1和A2/B2,个体231;新组合:A1/B2和A2/B1,个体39交换率:39/(231+39)=14%;A与B相距14cM,中英联合实验室,亲本:A1/B1和A2/B2,个体231;新组合:A1/B2,RFLP连锁图,我们直接检验由限制图谱获得的基因型,而不是检测其表型的特点左图表示三个世代限制图谱之间的血缘关系,其限制片段长度多态性(RFLP)可以按孟德尔方式遗传,四种等位基因在每代中独立地分离,但图中经限制酶消化后所有等位基因之间的组合在凝胶电泳中都存在,中英联合实验室,RFLP连锁图我们直接检验由限制图谱获得的基因型,而不是检测,基因与分子标记的共分离,共分离:如果限制酶多态性在基因组中自由发生,则有些会在特定基因附近产生。我们可以确定这样的限制性标记,因为该标记与突变表型密切相关。如果比较患病者的和正常人的DNA 限制图谱,可能发现一个特定的限制性位点通常出现(或者丢失)在患者DNA 中,原因是限制性标记与表型间100%相关。它暗示限制性标记与突变基因距离很紧,以至于它们在重组中不能分离,中英联合实验室,基因与分子标记的共分离共分离:如果限制酶多态性在基因组中自由,简单序列长度多态性,小卫星DNA的核心序列一般为几个到几十个核苷酸,不同个体的不同基因座位重复次数不同 ,每个重复单位的组成可略有变异。这类重复单位数目分布有限,有些染色体上还未发现这类 小卫星DNA。它的位置一般在染色体端粒部位。亦已证明,这一序列广泛存在于人体基因组中,中英联合实验室,简单序列长度多态性小卫星DNA的核心序列一般为几个到几十个核,中英联合实验室,中英联合实验室,2.4 人类遗传图,人类基因组计划的最初目标-完成一份遗传图,其密度至少为每1000kb 一个标记1994年完成,密度达到600kb一个标记含有5264个微卫星序列不久,另一份物理图也随之问世,其密度为每100kb一个标记含有7000个微卫星序列,中英联合实验室,2.4 人类遗传图人类基因组计划的最初目标-完成一份遗传,第三章 物理作图,限制酶作图基于克隆的基因组作图荧光原位杂交(FISH)序列标记位点(STS)人类基因组物理图,中英联合实验室,第三章 物理作图限制酶作图中英联合实验室,遗传图的分辨率有限:基因组大,人类及大多数高等真核生物不可能获得大量的子代遗传图的精确性低:重组热点,中英联合实验室,遗传图的分辨率有限:基因组大,人类及大多数高等真核生物不可能,3.1 限制性作图,比较不同限制酶产生的DNA片段的大小单酶切、双酶切、对比组装部分酶切:多个相同酶切位点区段只发生一次酶切末端同位素标记(或其他标记)结合部分酶切:形成梯形分布带,中英联合实验室,3.1 限制性作图比较不同限制酶产生的DNA片段的大小中英联,样品中仅存在较少的限制性位点/小分子量DNA分子,用常规的限制酶即可绘制物理图稀有切点限制酶,中英联合实验室,样品中仅存在较少的限制性位点/小分子量DNA分子,用常规的限,稀有切点限制酶特殊的凝胶电泳技术:脉冲凝胶电泳PFGE(电场方向不断变换),中英联合实验室,稀有切点限制酶中英联合实验室,中英联合实验室,中英联合实验室,3.2 基于克隆的基因组作图,3.2.1 载体质粒、噬菌体、粘粒啤酒酵母基因组主要是先构建粘粒文库,然后建立克隆重叠群完成测序高等生物基因组拟南芥1.2X105bp,需要25000个克隆人类基因组是拟南芥基因组的33倍,中英联合实验室,3.2 基于克隆的基因组作图3.2.1 载体中英联合实验室,大分子DNA的克隆载体酵母人工染色体YAC:重组YAC分子只能在酵母细胞中扩增着丝粒:在细胞分裂时负责染色体均等分配端粒:位于染色体端部的特异序列,保持人工染色体的稳定性自主复制起始点:在细胞中启动染色体的复制,中英联合实验室,大分子DNA的克隆载体中英联合实验室,中英联合实验室,中英联合实验室,缺陷:插入子稳定性问题、同一酵母细胞多个YAC引起交换产生嵌合噬菌体P1载体:与载体相似,将天然噬菌体基因组中的一段区域缺失,容量达125kb细菌人工染色体BAC:由大肠杆菌中F质粒衍生,容量达300kb,单拷贝复制,稳定,不会因重组发生嵌合P1人工染色体PAC:结合P1载体和BAC载体的优点,中英联合实验室,缺陷:插入子稳定性问题、同一酵母细胞多个YAC引起交换产生嵌,中英联合实验室,中英联合实验室,中英联合实验室,中英联合实验室,载体的种类和特征,中英联合实验室,质粒*受体细胞结构插入片断举例 E.coli环状 8*pU,3.2.2 重叠群组建,重叠群contig:相互间存在重叠顺序的一组克隆。最早组建重叠群方法染色体步移:从基因组文库中挑取一个指定的或随机的克隆,然后在文库中寻找与之重叠的第二个克隆。在此基础上再寻找第三个克隆,依次延伸染色体步移的速度缓慢,仅适合于小基因组及小区段染色体的物理图绘制,中英联合实验室,3.2.2 重叠群组建重叠群contig:相互间存在重叠顺序,中英联合实验室,中英联合实验室,指纹作图指纹fingerprinting:DNA样品所具有的特定DNA片段组成,限定的序列特征。指纹重叠,表明2个克隆具有共同的区段限制性带型指纹:用不同限制性酶处理样品,凝胶分析,DNA条带有部分相同,说明它们含有重叠的序列重复序列DNA指纹:不同克隆酶解电泳,转移到杂交膜中,用一种或几种基因组范围的重复序列作为探针杂交,出现相同的杂交带型,说明重叠重复序列DNA PCR:设计与重复序列互补的引物,对检测的克隆进行PCR扩增,相同的产物,说明重叠STS目录作图:STS是已知的单一序列。设计引物,对大量的单个克隆进行PCR扩增,中英联合实验室,指纹作图中英联合实验室,中英联合实验室,中英联合实验室,3.3 荧光标记原位杂交,FISH:与同位素杂交的原理相同,DNA荧光染料。荧光标记信号在显微镜下观测,直接显示探针与染色体杂交的位置杂交技术的一种延伸,杂交靶子是完整的染色体,由杂交信号提供作图信息。将样品涂抹在载玻片上自然干燥,然后用甲酰胺处理使其变性。中期染色体:主要用于确定新发现的分子标记属于哪条染色体,给出十分粗略的染色体定位机械伸展的染色体:分离与制备中期细胞核,离心,获得伸展的染色体,长度增加20倍。间期染色体:已获得基本的位置信息,极度松驰的染色体可用于小区段分子标记排序研究。,中英联合实验室,3.3 荧光标记原位杂交FISH:与同位素杂交的原理相同,D,3.4 序列标记位点(STS)作图,主流技术限制性作图:快速,信息详细,但不适合大基因组。重叠群构建程序复杂,费时费力。指纹作图:对大基因组存在不少问题,如选用的限制酶不当或重复顺序干扰,会出现误排。原位杂交:操作困难,资料积累慢,一次实验定位的分子标记不超过3-4 个。,中英联合实验室,3.4 序列标记位点(STS)作图主流技术中英联合实验室,STS:sequence tagged site,一小段长度100-500bp的DNA序列,每个基因组仅一份拷贝,易分辨。利用PCR/杂交分析所在STS位置,自动操作表达序列标签EST:cDNASSLP:具有多态性并已在连锁分析中定位随机基因组序列:在数据库中寻找所感兴趣的某些序列,中英联合实验室,STS:sequence tagged site,一小段长度,中英联合实验室,中英联合实验室,STS定位:定位在染色体或基因组中的DNA区段辐射杂种:含有另一种生物染色体片段的啮齿类细胞克隆作图:基因组测序计划的准备工作之一,将基因组或分离的染色体打断,并将这些片段克隆到高容量的载体中,构建全基因组文库。PCR方法检测含有标记的STS克隆,根据重叠的STS标记可绘制克隆连锁图,中英联合实验室,STS定位:定位在染色体或基因组中的DNA区段中英联合实验室,中英联合实验室,中英联合实验室,人类基因组物理图,1987年发表了第一份人类RFLP连锁图,含有393 RFLP和10个其他多态性标记,来自21个家庭,平均密度为10Mb1996年遗传图 5250个SSLP,0.7Mb1993年 33000个YAC采取辐射杂种进行STS标记作图,对YAC物理图进行校正。1996年STS图,含有7000个SSLP。物理图与遗传图彼此衔接,产生一份具综合性的完全整合的基因组图,成为人类基因组计划测序阶段的工作框架。,中英联合实验室,人类基因组物理图1987年发表了第一份人类RFLP连锁图,含,SNP作图的一般步骤包括:, 获取DNA序列 从DNA序列确定序列标签位点(sequence tagged sites, STSs) 扫描STSs或ESTs确定候选SNPs 确定SNPs 将SNPs定位于染色体特定位置,中英联合实验室,SNP作图的一般步骤包括: 获取DNA序列中英联合实验室,鸟枪法和重叠群法,基因组计划的基本目标是获得全基因组顺序,在此基础上再对所获得的序列进行解读。获得基因组顺序的主要方法是进行DNA测序,然后再将读取的顺序组装。目前的DNA测序每次反应仅能读取不到1000bp的长度,已知最小的细菌基因组为580kb。因此基因组测序的第一步是构建基因组图,然后将基因组区段分解逐个测序,最后进行组装。基因组作图的基本构想是,在长链DNA分子的不同位置寻找特征性的分子标记,根据分子标记将包括这些序列的克隆进行连锁定位,绘制基因组图。一旦构建好基因组图,即可着手进入全基因组测序。以基因组图指导的测序有2种路线: 直接鸟枪法 重叠群法,中英联合实验室,鸟枪法和重叠群法基因组计划的基本目标是获得全基因组顺序,在此,什么是鸟枪法,全基因组随机测序战略主要采用鸟枪法(shotgun)。鸟枪法,也俗称“霰弹法”,是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置“鸟枪法”优点是速度快,简单易行,成本较低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断但是用它来测序,最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。此外有许多序列片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成空缺。这些缺陷最终导致整个基因图会留下大量的空洞(gap),也影响其准确度,中英联合实验室,什么是鸟枪法全基因组随机测序战略主要采用鸟枪法(shotgu,重叠群法,以大片断定位的克隆为基础的定向测序战略主要采用克隆步移法或称重叠群法:先构建遗传图,再利用几套高度覆盖的大片段基因组文库(BAC、PAC等)获得精细的物理图,选择合适的BAC或PAC克隆测序,利用计算机拼装。BAC内的空洞基本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。然后由相互关联、部分重叠的BAC克隆连成一个大的重叠群(Contig)。理想状况下,整条染色体就是由一个完整的重叠群构成,中英联合实验室,重叠群法以大片断定位的克隆为基础的定向测序战略主要采用克隆步,重叠群法,但通常情况下部分BAC之间会有物理空洞(Physical Gap),这是目前国际上还未克服的难题。利用克隆步移法测序,国际上通行的标准要求BAC测序达到十倍覆盖率,使所测的序列达到99.99以上的准确度。该方法的技术难度较高,尤其大片段基因组文库(BAC)和精细物理图构建是技术性极强的工作此外,费用相对于鸟枪法要稍高一些,完成整个基因组测序周期也要长些。但是,通过这种方法得到的基因组数据是最为准确和精细的数据,也是基因组测序的最终目标。大基因组完成图目前大多都是通过这种方法获得的。基因组完成图,即完全覆盖所测物种的基因组、准确率超过99.99的全DNA序列图。完成图的覆盖率接近100,准确率更高,达到99.99,中英联合实验室,重叠群法但通常情况下部分BAC之间会有物理空洞(Physic,基因组测序的不同策略,重叠群法 所谓重叠群系指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。这是一种由上至下(up to down)的测序策略直接鸟枪法 首先进行全基因组鸟枪法测序,再以基因组图的分子标记为起点将鸟枪法DNA片段进行组装。高密度的基因组图分子标记可以检测组装的DNA片段是否处在正确的位置,并校正因重复顺序的干扰产生的序列误排。这是一种由下至上(bottom to up)的测序策略,中英联合实验室,基因组测序的不同策略重叠群法 所谓重叠群系指相互间存在重叠,中英联合实验室,中英联合实验室,基因组测序的不同策略,基因组图的绘制可为基因组的全面测序提供工作框架。由于一些分子标记同基因座位紧密连锁,为靶基因的定位克隆提供了可能。根据靶基因所在基因组图中的位置,可以尽快获知重要基因的顺序正是基于这些理由,人类基因组计划最初6年的工作重心主要放在人类基因组图的绘制上,中英联合实验室,基因组测序的不同策略基因组图的绘制可为基因组的全面测序提供工,