《遗传图绘制》PPT课件.ppt
第2章 遗传图绘制,基因组计划基本目标是获得全基因组顺序,在此基础上再对序列进行解读。获取基因组顺序的主要方法是进行DNA测序,然后再将读取的顺序组装。目前的DNA测序每次反应仅能读取不到1 000bp的长度,已知最小的细菌基因组为580kb。因此基因组测序的第一步是构建基因组图,然后将基因组区段分解逐个测序,最后进行组装。基因组作图的基本构想是,在长链DNA分子的不同位置寻找特征性的分子标记,根据分子标记将包括这些序列的克隆进行连锁定位,绘制基因组图。一旦构建好基因组图,即可着手进入全基因组测序。以基因组图指导的测序有二种可供选择的路线(图2.1):,克隆(clone)定义,一个共同前体通过无性繁殖而形成的一群基因结构相同的细胞或个体。(组培)基因克隆,则指一个基因反复扩增后产生的多个拷贝。动名词(cloning)即指获得克隆的过程或手段。利用体外重组技术将某特定的基因或DNA序列插入载体分子的操作过程。,1.重叠克隆群法 构建过程:DNA测序不能从染色体进行,首先必须克隆化。先构建片段DNA克隆(以YAC或BAC为载体),并把克隆依染色体排序,这就是“染色体的克隆图”。依片段DNA克隆在染色体上所在的位置排序,可以得到相互重叠的一系列克隆,叫做“克隆重叠群”(contiguous series of overlapping clones,Contig)。这些重叠克隆群之间往往是有间隙的,需通过染色体步行(chromosome walking)的方法将这些克隆群整合在一起。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。这是一种由上至下(up to down)的测序策略。,2.鸟枪法(shotgun sequencing method)将目的DNA随机地处理成大小不同的片段,再将这些片段的序列连接起来的测序方法。高密度的基因组图分子标记可以检测组装的DNA片段是否处在正确的位置,并校正因重复顺序的干扰产生的序列误排。这是一种由下至上(bottom to up)的测序策略。基因组图的绘制可为基因组的全面测序提供工作框架。由于一些分子标记同基因座位紧密连锁,同时为靶基因的定位克隆提供了可能。根据靶基因所在基因组图中的位置,可以尽快地获知重要基因的顺序。正是基于这些理由,人类基因组计划最初6年的工作重心主要放在人类基因组图绘制。,鸟枪法(shotgun sequencing method),2.1 遗传图与物理图,根据采取的方法不同将基因组作图分为两个范畴:遗传作图(genetic mapping)采用遗传学分析方法将基因或其他DNA顺序标定在染色体上构建连锁图。这一方法包括杂交实验和家系分析。遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。物理作图(physical mapping)采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。物理图的距离依作图方法而异,如辐射杂种(radiation hybrid)作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距单位为DNA的分子长度,即碱基对。,2.2 遗传作图标记,任何一类图谱都有可识别的标记,以便寻找目标的方位及彼此之间的相对位置。遗传图有特征性的位置标记用表示基因组中特定顺序所在的位置。,2.2.1 基因标记,经典遗传学研究一种性状的遗传必需要求同一性状至少有二种不同的存在形式或称表型。如孟德尔研究豌豆植株高与矮这种相对性状,每个相对性状都有一个不同的等位基因(allele)控制。最初人们识别的指令表型的基因都是通过肉眼观察辨认的,如果蝇躯体的颜色,翅膀形状等标记都可在低倍显微镜下或直接用肉眼进行分辨。这些研究虽然在遗传学发展的早期阶段取得了很好的结果,但很快遗传学家即意识到可见的表型性状数目十分有限,尤其是当多个基因影响同一性状时,遗传分析往往陷入困境。为了使遗传图具有更强的综合性,必需发现大量易于区分的、较为单一的性状,具有生化特征的表型具备上述要求。微生物如细菌及酵母遗传学研究中,依赖于生化表型的分析,已将一些生化性状基因进行作图。人类血型系列(ABO)分析,血清蛋白和免疫蛋白(人类白细胞抗原,HLA)变异研究都是利用生化的表型。这些生化特征较之可见表型的最大优点在于:它们属于多等位基因(multiple alleles)。例如HLA-DRBI(human leukocyte antigens-DRBI,人类白细胞抗原DRBI)基因位点有至少59个等位基因,HLA-B位点至少有60个等位基因。,2.2.2 DNA标记,虽然基因标记非常有用,但并非理想的标记。原因之一是,高等生物如脊椎动物和显花植物,可用作标记的基因十分有限,许多性状都涉及多基因。此外高等生物基因组中存在大量的基因间隔区,纯粹用基因作为标记将在遗传图中留下大片的无标记区段。还有一个原因是,只有部分基因其等位基因成员可以通过常规实验予以区分,因而产生的遗传图是不完整的,必需寻找其他更有效的标记。基因之外的作图工具统称为DNA标记。与基因标记一样,DNA标记也必须有等位成员。有三种类型的DNA顺序可满足上述要求:,1.限制性片段长度多态性(restriction fragment length polymorphisms,RFLP)RFLP概念产生于1980年(David Bostein等),其基本设想是,由于同源染色体同一区段DNA顺序的差异,当用限制酶处理时,可产生长度不同的限制性片段,这些DNA片段经琼脂糖凝胶电泳分离,可直接显示不同个体同一位点DNA组成的差异(图2.2)。限制酶识别的碱基顺序有专一性,所以用不的限制酶处理同一DNA样品时,可以产生与之对应的不同限制性片段,可提供大量位点多态性信息。RFLP是第一种被用于作图研究的DNA标记,它们一般有如下特征:处于染色体上的位置相对固定;同一亲本及其子代相同位点上的多态性片段特征不变;同一凝胶电泳可显示不同多态性片段,具有共显性特点。,2.简单序列长度多态性(simple sequence length polymorphisrns,SSLP)SSLP产生于重复顺序的可变排列,同一位点重复顺序的重复次数不同,表现出DNA序列的长度变化。与RFLP不同的是,SSLP具多等位性(multiallelic),每个SSLP都有多个长度不一的变异体。有两种类型的SSLP常用于作图:小卫星序列(minisatellite)又称可变串连重复(variable number of tandem repeats,VNTR),其重复单位的长度为数十个核苷酸。微卫星序列(microsatellite)也称简单串连重复(simple tandem repeats,STR),其重复单位为1-6个核苷酸,由10-50个重复单位串连组成。Beckman等曾计算过人类基因组一段745kb DNA中微卫星序列的数目,平均每6kb一个位点。人类基因组中76%的重复顺序为A、AC、AAAN、AAN或AG,丰度依次递减。作图中应用最广的重复顺序为AG,主要分布在5和3非翻译区以及内含子中。人约80%的A、AAAN、AAN重复顺序以及50%的AT微卫星序列位于人类基因组Alu重复顺序的3端。人的X染色体平均每300-500kb有1个三核苷酸和1个四核苷酸微卫星序列,因其比二核苷酸微卫星序列更易分型(图2.3)。,微卫星序列的应用比小卫星序列的应用普遍得多,原因有二:其一,小卫星序列在基因组中的分布很不均匀,大多集中在染色体的端部,而微卫星序列在整个基因组中不仅分布广且密度高;其二,微卫星序列便于PCR分析,当PCR扩增的DNA长度少于300bp时,反应既快速又精确。小卫星序列因其重复单位较长,加之许多重复顺序往往串接在单个顺序中,不利于PCR对样品的扩增。微卫星序列的多态性信息量(polymorphic information content,PIC)某一标记在群体中出现多态性的频率。一般大于0.75。大多数微卫星序列均有4个或更多的等位型,50%以上的家庭其成员均有足够的微卫星序列多态性信息可供连锁分析。虽然微卫星序列的功能还不清楚,但它却是遗传图与物理图研究中非常有用的工具。由于微卫星变异很大,在同一物种的不同个体中微卫星重复单位的数目有广泛的差异。微卫星序列中拷贝数的变化主要产生于DNA复制时出现的“滑序”事件,使重复单位的拷贝数增加或减少。这种变异使得人群中任何2人在若干位点微卫星的组合几乎都不相同。假如我们有可能检测每个人的微卫星序列,则可编制每个人独有的遗传档案(genetic profile)。,3.单核苷酸多态性(single nucleotide polymorphisms,SNP)基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500-1 000个碱基对中就有1个,估计其总数可达300万个甚至更多。基因组中单个核苷酸的突变称为点突变,理论上每个单核苷酸位置最多只有四种形式,即A、T、C和G。某些群体在特定的单核苷酸位置只有2个或3个SNP,这些位点称为双等位(biallele)或三等位(triallele)(图2.4)。在基因的编码顺序中,SNP大多位于密码子的摇摆位置,表现为沉默突变而被大量保留下来。大多数SNP所在的位置不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测。二倍体细胞中每个SNP最多只有2种等位型。与RFLP类似,SNP在同一个体中常常会以纯合状态存在。对某一特定的SNP,同一家系的成员可能有相同的基因型。尽管如此,SNP仍具有RFLP所不可比拟的其他优点,如SNP在基因组中的数量极大,人群中几乎任何2个个体的基因组都有许多SNP。,2.3 遗传作图的方法,2.3.1 孟德尔遗传学简介遗传图绘制主要依据由孟德尔的遗传学原理。他发现每株豌豆都有2个等位基因,但只出现一种表型。当植株完全自交时会产生纯合子(homozygous),它们有2个相同的等位基因,出现可预知的表型。孟德尔进一步证明,2个具有不同表型的纯合植株杂交,杂种一代所有植株的表型一致。F1代植株为杂合子。它们从其双亲各继承了一个等位基因。F1代植株所表现的性状称为显性性状,未表现的性状为隐性性状。孟德尔二条遗传定律:等位基因随机分离,即F1代的每个成员都有相同的机会传递A或a等位基因;非等位基因自由组合,即位于不同基因座位的等位基因独立遗传。根据这二个定律,一个杂交试验的结果是可以预期的。一个基因的2个等位基因在二倍体细胞中各由 2条同源染色体携带,它们从亲本传递给子代是按孟德尔的方式进行的,并与二倍体在减数分裂时产生单倍体的事件相一致。孟德尔当时只观察到了简单的显隐性规律,有些现象未曾遇到。如不完全显性,即杂合子表现为2个纯合子的中间表型。另一种现象为共显性,即杂合子同时出现2个等位基因的表型。孟德尔对遗传学作出了重大贡献,但也犯了一个不小的错误。因为按照孟德尔第二定律将不允许连锁(linkage)发生,实际上当2个不同的基因位于同一染色体上时,2个不同的等位基因将共同遗传。孟德尔的后继者发现了连锁,为遗传作图奠定了实验基础。,2.3.2 连锁分析,连锁分析于1905年,分别由Bateson、Saunder和Punnett发现,但是直到1910-1911年Morgan以果蝇为实验对象开始他的经典遗传学的奠基式工作时,连锁分析的重要意义才逐渐被人们所了解。20世纪初期,遗传学家已经认识到基因位于染色体上,每条染色体均以完整的单位传递。换句话说,如果有2个基因位于同一条染色体上,它们则机械地连接在一起,共同传递给下一代。这种看似确切无疑的假说随后发现在大多数情况下并不符合观测到的试验结果。当遗传学家采用类似孟德尔早期豌豆杂交的方法观察子代的性状分离时发现,原先认为位于同一染色体上的基因,只有极少数是完全连锁的。这些被观察的成对基因要么显示独立遗传,要么表现部分连锁,或者说他们时而共同传递,时而分道扬镳。正是这种理论预期与实际结果的矛盾孕育着遗传学上的重大突破,由此而诞生了一项关键技术遗传连锁作图。,减数分裂时期染色体的行为解释了为何同一染色体上的基因表现为部分而非完全连锁现象。摩尔根对遗传学的重大贡献在于,他从基因的部分连锁与细胞减数分裂时染色体行为之间的关系中领悟到其间的内在联系,从而在观念上产生了飞跃。19世纪后期,细胞学家已能区分二种细胞分裂类型:有丝分裂与减数分裂。有丝分裂主要发生在体细胞的二倍体细胞核中,由此产生的子细胞均从母细胞获得同等的遗传物质。人的一生中要经历大约1017次有丝分裂产生所需的体细胞。有丝分裂开始前,每条染色体在细胞核中复制,复制的染色体并不马上彼此分开,而是附着在着丝粒上。直到有丝分裂的晚期,复制的染色体才均等地分离形成二个新的子代细胞核。,有丝分裂细胞核中所发生的事件与遗传作图并无直接关连,我们感兴趣的只在减数分裂。减数分裂只发生在生殖细胞中,二倍体母细胞产生4个单倍体配子,每个配子在有性生殖时与来自另一性别的配子融合,恢复到原来亲代的染色体倍数。有丝分裂与减数分裂的相同之处在于,每条染色体都必须经历1次复制;不同之处是,有丝分裂的细胞只发生1次分裂,而减数分裂的细胞则发生连续2次细胞分裂。第二次细胞分裂时,染色体数目减半。有丝分裂与减数分裂的另一个更为关键的差别是姐妹染色体变换。二倍体细胞中每条染色体都有2份拷贝,这2份拷贝称之为同源染色体。有丝分裂中,同源染色体的2份拷贝分别独立复制,然后彼此分离进入子细胞。减数分裂时,成对同源染色体并非独立行动。在减数分裂I期,每条同源染色体复制后并不马上分开。携带2份拷贝的同源染色体彼此靠拢,同源区段并排形成双价体(bivalent)。在双价体中,并列的同源染色体臂(染色单体)会发生机械断裂,彼此交换DNA区段,这一过程被称为交换(crossing-over)或重组(recombination)。同源染色体的交换由比利时细胞学家Janssens于1909年发现,2年后摩尔根开始思考他的部分连锁问题。,交换的发现如何帮助摩尔根解释部分连锁问题呢?我们先来考查染色体交换对基因传递方式的影响。假定有二个位于果蝇2号染色体上的基因分别为A和B,它们都有2个等位基因,即A与a,B与b。现在我们跟踪这2对基因在减数分裂时如何分布到配子中,这里有两种方案可供选择(图2.5):A与B位点之间不发生交换。如果发生这种情况,只有二种配了产生,一种携带A与B基因,另一种只携带a与b。A与B之间发生交换。这将导致一段携带B基因的染色体区段与携带b基因的同源染色体区段相互交换,由此产生4种配子类型,即1AB、laB、1Ab和lab。,假定有100个相同的减数分裂细胞,在不发生交换时产生下列数目的基因型配子:200 AB 200 ab 这是完全连锁的结果:基因A与B的行为在减数分裂时类似一个整体。如果在某些减数分裂细胞中发生交换,这2对等位基因成员的传递将不是作为一个单位。假定100个减数分裂事件中,有40个发生变换,将产生下列配子:160 AB 160 ab 40 Ab 40 aB 这种连锁是不完全的,或者说是部分的,因为在产生的配子中出现了新的连锁形式,即Ab与aB。,部分连锁与遗传作图,当摩尔根认识到部分连锁可以通过碱数分裂中的交换给予解释,他即考虑如何设计一种方法来确定基因在染色体上的位置。关键的突破并不是摩尔根本人,而是他的一位研究生Arthur Sturtevant。Sturtevant设想如果交换是随机发生的话,那么一对并列的染色单体上任何位点发生交换的机会部是均等的。似如这种设想是正确的,那么2个彼此靠近的基因之间因交换而分离的频率要比相互远离的2个基因之间发生分离的频率要小。或者说,因交换使2个连锁基因分开的频率应同它们在染色体上所处位置的距离成正比,而重组率(recombination frequency)则可成为测量基因之间相对距离的尺度。只要获得不同基因之间的重组率,就可绘制一份基因位于染色体上相对位置的地理图(图2.6)。,遗传图的偏离,Sturtevant关于随机变换的设想极富创见但不完全正确。大量细胞遗传学的研究表明,染色体的各个区段交换频率有很大差别。例如,近端粒区和远着丝粒区有较高的重组率。染色体的某些位点之间比其他位点之间有更高的交换频率,被称为重组热点(recombination hot spot)。如老鼠主要组织兼容性复合座位(major histocompatibility complex,MHC)含有一组控制免疫反应的基因,其中有一个区段的重组率高于平均数数百倍。这一热点引发的所有重组事件均发生在基因Eb的第二个内含子中,长度为4.3kb。在这一热点区还检测到一个9/11核苷酸一致顺序,即5-TGGAAATCCCC-3,这一顺序在其他重组热点中亦已发现。除上述造成遗传图偏离的现象之外,性别之间也会表现重组率的差异。图2.7所示为人类1号染色体一个区段的遗传图,男性与女性之间染色体交换频率在同一位点彼此相异,各有一个性别专一性重组热点。就一般规律而言,由女性减数分裂事件绘制的遗传图比男性减数分裂事件绘制的遗传图长得多(表2.1)。,连锁分析时,还会遇到同一染色单体发生多起交换的现象。当多起变换发生在二个基因之间时,会产生距离减少的假象。尽管遗传图存在以上一些偏差,但连锁分析给出的遗传标记在染色体上的排列次序是相当准确的,也提供了基因间的大致距离,它们为基因组测序计划提供了极有价值的工作框架。,2.3.3 不同模式生物的连锁分析,减数分裂重组率的分析只适用于有性生殖的生物,缺少有性生活史的生物必须采取其他作图策略构建连锁图。由于伦理学的问题,有计划的杂交试验不适用于人类。此外有些生物因妊娠期过长以及从出生到成熟要渡过很长时期也限制了这一方法的应用,因此必须寻找可替代的作图方式。根据资料收集的方法,可将连锁分析分为三大范畴:有性杂交实验 根据需要有计划地实施杂交方案进行连锁分析,如果蝇、老鼠以及玉米、水稻等动植物的遗传学实验。系谱分析 不能进行有计划的遗传试验,只能收集家系成员的相关资料进行连锁分析,主要涉及人类以及多年生的树木等。DNA转移 不发生减数分裂的生物,如细菌与病毒基因组的连锁分析。,杂交试验的连锁分析 摩尔根进行的连锁分析都是人为控制的模式生物的有性杂交。这一方法的基本程序大都相同,即首先选择已知基因型的亲本,设计杂交方案,获得交配的子代并分析其表型及基因型。两点杂交 基因作图的关键在于确定减数分裂产生的配子基因型。少数情况下,配子的基因型可直接分辨,如啤酒酵母有配子体世代,在特定培养基上能直接检测其生化基因型。当某些真核生物的精细胞经PCR放大获得足够DNA分子时,亦可直接用RFLP、SSLP和SNP测定其基进因型,但这一方法实际操作有很大困难。常规的真核生物连锁分析并非直接检测配子的基因型,而是通过试验确定二种配子融合产生的二倍体子代基因型,即遗传杂交试验。遗传杂交试验产生的二倍体子代不是一种(单性)减数分裂的产物,而是二种(双性)减数分裂配子的融合。大多数生物所产生的雌雄配子都会发生机率大体一致的交换。我们的目的必须从二倍体子代基因型中分清哪些变换事件来自父亲,哪些来自母亲。为了便于检测,常用测交(test cross)方法分析子代基因型的分离比,并由此推测亲代细胞减数分裂时同源染色体的交换频率。,多点杂交 1条染色体上有许多连锁的基因,这些基因所在的位置及其相对排列次序可由多点杂交分析确定。单杂交只能确定2个位点是否连锁及其连锁的程序,当涉及第3个位点时,必须采用双杂交的方法检测其连锁关系及连锁程度。双杂交与单杂交略有不同。假定有3个基田座位A、B和C,等位基因为a、b和c。一个亲本基因型为三位点杂合子,另一亲本为三位点纯合子。可以预期测交子代中比例最高的基因型为双亲基因型,其次是A与B或C,B与A 或C之间发生的交换;最少的基因型是在A与C和B与C之间同时发生交换的基因型。第二类重组事件(表中51个和63个子代)可假定产生于一次单变换。从51个子代的重组事件可推测,A座位与B和C之间已发生重组,而63个子代重组事件产生于B与A和C之间的重组。这说明A与B座位应位于两侧,而C处在A与B之间。这一点可由C座位与A和B之间发生重组所产生的子代数目证实,因为只有A与C,和C与B之间发生双交换才能出现这一基因型(表2.2)。,RFLP连锁图,以性状作为标记的作图方法有很大的局限,除了可供选择的标记数量不多之外,二倍体生物的表型都有显性与隐性的区别。因此要获得隐性性状的分离比,必须得到基因型纯合的个体。在实际操作过程中,只有通过下一代个体性状的分离才可推测上一代的基因型组成。DNA分子标记不以表型为参照,直接检测个体基因型的组成,具有共显性的特点,因此可提供当代个体基因型分离比。,RFLP是最早用于构建基因组遗传图的分子标记,目前仍被广泛采用。以DNA分子标记构建遗传图的操作程序与经典的遗传作图类似,只是统计的性状改为DNA标记。图2.8描述了一般的RFLP连锁图绘制的过程。已知在同一连锁群上有2个座位分别为A和B,亲本P1和亲本P2在A和B座位分别有一对DNA标记Al和A2、B1和B2,在凝胶电泳中A1、A2、B1和B2有特征性的迁移图谱。DNA标记可在亲子代中稳定遗传,因此A1、A2、B1和B2在上下代的迁移位置是不变的。当P1与P2杂交后,F1代具有两个亲本共有的DNA标记电泳图。F1代自交后,如果在A与B座位间发生交换,将会出现4种DNA标记电泳图:2种与亲本相同,另外2种为新的组合,即A1/B2和A2/B1。凝胶电泳中除亲本外每一泳道代表的均为F2代个体,RFLP的电泳图表示不同个体的基因型。假定F2代具有亲本基因型的个体为231,重组基因型A1/B2+A2/B1为39。由计算得知座位A与B之间的交换率应为39/(231+39)=14%,即A与B相距14cM。,基因组RFLP连锁图的密度与DNA分子标记的来源有关。在基因组计划的早期,可用的分子标记非常有限,因而绘制的连锁图间隙很大。随着分子标记的增加,标定位点的之间的图距逐渐减少,如水稻基因组连锁图已定位的分子标记超过2 000,每个cM平均含有1个标记。,基因与分子标记的共分离,传统的遗传连锁图定位只能给出某一基因所在染色体上的大致位置,并且这种位置只是抽象的,据此我们无法克隆真实的基因。RFLP连锁图的建立使我们有可能借助分子标记共分离试验,找到基因所在的确切位置,并为靶基因克隆奠定基础。假如基因附近有一个紧密连锁的分子标记,在细胞减数分裂时分子标记与基因之间由于相距太近很少有机会发生变换。在有性繁殖的后代,这种分子标记与连锁的基因有最大的可能同时出现在同一个体中,这一现象被称为共分离。寻找与靶基因共分离的分子标记是图位克隆(map-based cloning)的一个关键步骤,这是一个逐步推进的过程。首先可从RFLP框架连锁图中找到与靶基因位于同一连锁群的分子标记,然后再从同一连锁群的分子标记中检测与靶基因接近的分子标记,依次渐进,直至获得最接近基因座位的标记为止(图2.9)。,系谱分析作图,人们不可能为特定的作图目的预先选择父母的基因型来设计人类遗传学试验,人类基因重组频率的计算只有通过检测现有家系连续世代成员基因型才能获得。这意味着只能获取有限的数据,难以对结果给予满意的解释。特别是人类的婚配不可能像遗传学上的测交那样预先设计,加上家族成员有的已经去世,有的不愿配合,更增加了基因型分析的困难。为此人们设计了一种称为系谱分析的方法用以绘制人类遗传图,在获得相应的RFLP标记后,可采用类似程序构建RFLP连锁图(图2.10)。,由于系谱分析所能提供的样品非常有限,因此必须借助统计学方法对获得的数据进行可信度检验,常用的程序为lod值(lod score,优势值)评价。lod值是基因连锁可能性的对数,用于初步判断所研究的2个基因是否位于同一染色体上。换句话说,可以回答2个基因是否连锁。如果lod分析确定是连锁的,然后可以提供最可能的重组频率的程度。理想的情况是,现有的资料来自1个以上的家系,由此增加结果的可信度。为了绘制一份详细的人类基因组遗传连锁图,巴黎的人类多样性中心(Centre dEtude du Polymorphism Humaine,CEPH)收集与保留了许多这类样品,包括一些家系的培养细胞系。研究者只要同意将获得的结果告诉CEPH的资料中心,即可从CEPH处获取样品用于DNA标记作图。,细菌的遗传作图,细菌基因组的遗传作图面临的主要困难在于,这类生物一般都是单倍体,不发生减数分裂,因此必需设计一些方法使细菌DNA的同源区段发生交换。解决的办法有三种,它们都涉及到使DNA片段从一个细胞转移到另一个细胞(图2.11):转导(transduction)以噬菌体为媒介,将长度可达50kb的DNA片段从供体细胞转移到受体细胞。转化(transformation)供体细胞释放的一段DNA(通常小于50 kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆。接合转移(conjugation)两个细菌机械接触,其中一个细菌(供体)将DNA转移到另一个细菌(受体)中。转移的DNA可以是供体细胞染色体的一段拷贝,亦可是整个的染色体,长度可达1Mb。转移的DNA也可是质粒,即附加体转移(episome transfer)。供体DNA分子在转移后,必须与受体细胞DNA发生双交换才能整合到受体细胞染色体中。如果不发生双交换,转移的DNA将随受体细胞的分裂而丢失。只有附加体的转移是例外,因为质粒可以独立于寄主染色体复制。,细菌遗传作图中采用的都是生化标记,显性或野生型表型具有生化特性(如合成色氨酸的能力,对抗生素的敏感性等),隐性表型(如不能合成色氨酸)是可以互补的性状。基因转移通常是在具有野生型等位基因的供体品系与具有隐性等位基因的受体品系之间进行,根据受体细胞是否获得基因指令的生化功能可监测转移的DNA是否进入受体细胞。作图的程序依赖于基因转移的方式,在接合作图中,供体DNA像一条细线顺次进入受体细胞。根据野生型基因进入受体的时间表,可以确定基因所在的位置。转导及转化的作图是依据所研究的基因是否同时出现在受体细胞中,转移的DNA片段一般较短(50kb)。两个基因同时被转移到受体细胞中的机会有赖于它们在细菌染色体上所处的位置是否靠近,紧密连锁的基因总是有最高的机率被同时转移。,2.4 人类遗传图,人类基因组计划最初目标是完成一份遗传图,其密度至少为每1 000 kb一个标记。这一目标于1994年完成。2年后遗传图的密度达到每600kb一个标记。这份遗传图含有5 264个微卫星序列,组成顺序为:5-ACACACACACACAC-3。CEPH收集了8个家系的样品用于遗传图绘制研究。这些家系共由134个个体组成,检测的减数分裂事件共计186次,得到的资料用来构建1至22号染色体遗传图。为了绘制X染色体遗传图,增加了12个家系共170个个体,提供了105次减数分裂事件。增加这些个体是因为在家系中与x连锁的重组事件不多,因为男性个体只有1条x染色体。,连锁分析将5 264个标记指定到2 335个染色体位置,被指定的位置数之所以少于所用标记数,是因为有些标记彼此太靠近无法区分而定位在同一位置。整个的遗传图密度平均为599kb,较高的如17号染色体密度为495 kb,较低的如9号染色体767kb,基因组中只有3个区域标记的间隔达到4 000kb。实际上这些间隔并非达到这一距离,可能其中含有重组热点。热点两侧的标记因其间的区段出现较高的重组事件而使距离增加。这份遗传图发表不久,另一份物理图也随之问世,其密度为每100kb一个标记。该物理图及其他物理图包括遗传图中已有的7 000个微卫星序列,因而可整合成一份综合的人类基因组图。,