第十一章 群体遗传与进化ppt课件.ppt
第十一章 群体遗传与进化,群体遗传学(population genetics)是一门研究群体的遗传组成及其变化规律的遗传学分支学科。它应用数学和统计学方法研究群体中的基因及其频率和可能的基因型及其频率以及影响这些频率的选择效应、突变作用、迁移和遗传漂变作用与群体遗传结构的关系,从而探讨生物进化的机制。,第一节 群体的遗传结构第二节 Hardy-Weinberg定律第三节 影响遗传平衡的因素第四节 自然群体中的遗传多态性第五节 物种形成第六节 分子进化与中性学说,第一节 群体的遗传结构,一、孟德尔群体与基因库,孟德尔群体(Mendelian population):是指可以互相交配或潜在的有交配能力的许多个体的集合体。最大的孟德尔群体是一个物种。基因库(gene pool):指一个群体所包含的所有基因的总和。,二、基因频率与基因型频率,1.基因型频率(genotype frequency)在同一个基因的座位上,某一种基因型的个体数在总群体中所占的比率。,B,B,b,b,B,b,例:深红虎蛾(Panaxia dominula)497只虎蛾基因型分别为:BB=452,Bb=43,bb=2它们的基因型频率分别是:f(BB)=452/497=0.909f(Bb)=43/497=0.087f(bb)=2/497=0.004合计:1.000,B,B,b,b,B,b,2.基因频率(gene frequency)群体中某个基因座位上特定基因的拷贝数占群体中该座位所有等位基因数的比例。,例:深红虎蛾(Panaxia dominula)497只虎蛾基因型分别为:BB=452,Bb=43,bb=2它们的基因频率分别是:f(B)=(2BBBb)/(2个体总数)=(2452+43)/(2497)=0.953 f(b)=(2243)/(2497)=47/994=0.047,复等位基因的基因频率牛奶草甲虫葡萄糖磷酸变位酶(PGM)座位上有3个等位基因,每个等位基因编码了酶的不同分子变异体,在一个群体中基因型的数目收集如下:AA=4,AB=41,BB=84,AC=25,BC=88,CC=32,共计274个甲虫。它们的等位基因频率是:f(A)=(24+41+25)/2274=0.135f(B)=(284+41+88)/2274=0.542f(C)=(232+88+25)/2274=0.323,3.由基因型频率来计算基因频率,群体内,某基因座上有两个等位基因A和a,它们在群体中组成3种基因型:AA、Aa和aa。,A和a的基因频率为:P=+=+=D+Hq=+=+=R+H,p=D+H q=R+H,推导出以下公式:,例:深红虎蛾基因型频率为:D=f(BB)=0.909H=f(Bb)=0.087R=f(bb)=0.004则,基因频率为:f(B)=P=D+1/2H=0.909+(1/2)0.087=0.953f(b)=Q=R+1/2H=0.004+(1/2)0.087=0.048,第二节 Hardy-Weinberg 定律,1908年由英国数学家G.H.Hardy和德国医生W.Weinberg分别独立地发现的,故称为哈迪温伯格定律(law of Hardy Weinberg),又可称为哈迪温伯格平衡(Hardy Weinberg equilibrium)。,当一个大的孟德尔群体的个体间进行随机交(婚)配(random mating,RM),即一种性别的任何一个个体有同样的机会与相反性别的个体交配的前提条件下,同时没有选择(selection)、没有突变(mutation)、没有迁移(migration)和遗传漂变(genetic drift)发生时,下一代基因型的频率将和前一代一样,于是这个群体被称为处于随机交配系统下的平衡中。,一、定律的要点1.在随机交配的大群体中,如果没有影响基因频率变化的因素存在,则群体的基因频率可代代保持不变。2.在任何一个大群体中,不论上一代的基因频率如何,只要经过一代随机交配,由一对位于常染色体上的基因所构成的基因型频率就达到平衡,只要基因频率不发生变化,以后每代都经过随机交配,这种平衡状态始终保持不变。3.在平衡状态下,D=p2、H=2pq、R=q2。,此定律可分为3个部分:第一部分是前提:理想群体,无穷大,随机交配,没有突变、没有迁移和自然选择。第二部分是结论:基因频率和基因型频率逐代不变。第三部分是关键:随机交配一代以后基因型频率将保持平衡。,D=p2、H=2pq、R=q2,二、定律的证明,设在常染色体的基因座A上有两个等位基因A1和A2,群体中可能的基因型有A1A1、A1A2和A2A2三种,设某一世代(零世代)具有以下基因型频率和基因频率:,零世代个体进行随机交配,产生的一世代个体的基因型频率和基因频率如下:,三、平衡群体的基本特征,1.在一个二倍体的群体中,杂合体的频率(H2pq)是当pq12时,最大值为 0.5。,2.杂合体的频率(H)(或频数)是两个纯合体频率(D、R)(或频数)的乘积的平方根的2倍。即:的比例为2与群体的基因频率无关。该性质可以作为平衡的一种简单的数学检验。,3.群体点(population point,P)在齐次坐标中的运动轨迹是在 4DR H2 0的抛物线上。,例:一个随机交配的平衡群体(D0.49,H0.42,R 0.09)的群体点P落在4DRH20的抛物线上。,4.平衡群体中的AaAa交配的频率为AAaa交配频率的2倍。因为AaAaH24p2q2,而 AAaa2DR2p2q2。所以杂合体之间的交配频率永远是显性纯合体与隐性纯合体之间交配频率的2倍。这种数学关系与群体中的基因频率完全无关,适合任何平衡群体。,5.如果在一对等位基因遗传的平衡群体中一个基因的频率(q)很低,另一个等位基因的频率(p)则接近于1,Hardy Weinberg比例将取得一种极限形式:,四、定律的应用,1.共显性时表型与基因型一致,可以从表型直接辨别基因型,只要统计不同表型所占比例,就可以得到相应的基因型频率,由公式可计算出基因频率。例:人类的MN血型在我国某大城市调查了1788人的MN血型,其中397人M型(LMLM);861人是MN型(LMLN);530人是N型(LNLN)。判断该抽样群体中的3种基因型频率是否符合Hardy Weinberg平衡?,LM 基因频率:p=0.2220+(1/2)0.4816=0.4628LN 基因频率:q0.2964+(1/2)0.4816=0.5372,将计算得到的p、q 值代入下表,作2 检验。,查2表,差异不显著。表明3种基因型频率符合Hardy Weinberg平衡定律。,2.完全显性时显性纯合体与杂合体表型相同,外表不能识别,只能通过隐性纯合子的基因型频率来计算q,而p=1-q。例:人类的白化病(aa)白化病在人群中的发生率约为0.0001,即白化病的基因型频率为R(aa)=0.0001q=R=0.01p=1-q=0.99杂合体频率H=2pq=20.990.01=0.02,四、哈迪-温伯格定律的扩展假如存在3个等位基因A,B和C的话,它们的频率分别为p、q、r,在平衡时基因型的频率也等于等位基因频率的平方:(p+q+r)2=p2+q2+r2+2qp+2pr+2qrAA=p2 BB=q2 CC=r2AB=2pq AC=2pr BC=2qr,例:长岛海峡兰色的贻贝群体中有一基因座位编码亮氨酸肽酶,这个座位有3个等位基因:等位基因 频率LAP98 p=0.52LAP96 q=0.31LAP94 r=0.17,若这个群体达到哈迪-温伯格平衡,预期它们的基因型频率将是:基因型 预期频率LAP98/LAP98 p2=(0.52)2=0.27LAP98/LAP96 2pq=2(0.52)(0.31)=0.32LAP96/LAP96 q2=(0.31)2=0.10LAP96/LAP94 2qr=2(0.31)(0.17)=0.10LAP94/LAP98 2pr=2(0.52)(0.17)=0.18LAP94/LAP94 r2=(0.17)2=0.03,第三节 影响遗传平衡的因素,Hardy-Weinberg的平衡群体是一个理想的群体,有许多因素会影响Hardy-Weinberg群体的平衡。,一、突变,A基因频率 f(A)=pa基因频率 f(a)=q正向突变(Aa)的频率为u,回复突变(aA)的频率为v。,每一代中有(1 q)u 的A基因突变为a有qv 的a基因回复突变为A若(1q)u qv,则a基因的频率增加若(1q)u qv,则A基因的频率增加于是每代a基因频率的净改变量为:q(1q)uqv,经过足够多的世代,这两种相反的力量相互抵消时,q 0,即表明基因频率保持不变,群体处于平衡状态。在平衡时,a基因的平衡频率q可由下式求得:,分别表示a基因与A基因平衡点的频率,平衡点的基因频率只决定于正、反突变的突变率,而与初始的基因频率无关。,假设:在极端情况下,只有一个方向发生突变,即v=0A0=p0,a0=q0;A1=p1,a1=q1An=pn,an=qn则:p1=p0-p0u=p0(1-u)p2=p1-p1u=p1(1-u)=p0(1-u)2即:pn=p0(1-u)n由于一般情况下,u很小(10-410-7),1-u1,因此突变对基因频率的改变是很难的,况且还有回复突变。,二、自然选择,达尔文(Darwin C.,1809-1882):英国博物学家。,自然选择的作用是指不同的遗传变异体具有差别的生活力和(或)差别的生殖力。自然选择的观点被苏联遗传学家Th.Dobzhansky精辟归纳为:自然选择的本质就是一个群体中的不同基因型的个体对后代基因库作出的不同贡献。,1.适合度和选择系数 适合度(fitnees):某一基因型与其他基因型相比,能够存活并留下后代的相对能力。它是一种基因型的个体在某种环境下相对的繁殖效率或生殖有效性的度量,用W来表示。以生殖最多的基因型的适合度为1。未能交配或交配后未能产生后代的基因型适合度为0。,工业黑化现象灰色桦尺蠖(Biston betularia)椒花蛾黑化型(carbonaria)1880年黑蛾的比例已超过了90%1959年黑色型为93.3%,英格兰伯明翰的黑色和浅灰色B.betularia的相对适合度,选择系数(selective coefficient):由于选择作用使一种基因型适合度减少的值。用S表示。S=1-W,3.自然选择的作用(1)选择对隐性纯合体不利-sq2(1-q)q=1-sq2当q或s很小时,q-sq2(1-q)说明当选择系数很小或a基因频率很低时,a基因频率的改变是很小的,选择的作用不大。,(2)选择对显性基因不利-sp(1-p)2 p=1-sp(2-p)同理,当s或p很小时,p-sp(1-p)2说明当选择系数很小或A基因频率很低时,A基因频率的改变是很小的,选择的作用不大。比较:p-sp(1-p)2-sp q-sq2(1-q)-sq2由于p及q均小于1,因此p大于q,说明在选择对显性基因不利与选择对隐性基因不利相比较时,A基因的改变(减少)比a基因大。这是因为当选择对隐性基因不利时,部分基因以杂合体形式存在,不受自然选择的影响。,三、迁移迁移(migration)或基因流(gene flow)是指个体从一个群体迁入另一群体或从一个群体迁出,然后参与交配繁殖,导致群体间的基因流动。,如果迁入者(immigrants)和迁出者(emmigrants)的比例为 m,设迁入者从其他群体随机地进入 S群体(土著),迁出者从 S群体迁出其他群体。且有 0 m 1。S群体中 A、a 基因频率分别为 p0、q0,迁入者的频率分别为 p0、q0,迁移发生在群体中的个体进行生殖以前,迁入者在 S中生殖,迁出者不在 S内生殖。则经过一代迁移后,混合群体中 a基因频率为:q1(1 m)q0 mq0 m(q0 q0)q0或有:q1q0 m(q0 q0)若每代 m不变,连续 n代之后的混合群体内的基因频率为:qn q0 q0(1m)n(1 m)nq0,n 迁移发生的世代数m 迁移速率或基因流动速率qn 迁移n代混合群体中的a基因频率q0迁入者的a基因频率q0 土著(或祖先)群体中的a基因频率,可以证明该等式最终为:,根据上式可计算出基因流动的速率 m,当其他条件都已知时,由于迁移率往往比突变率要大很多,所以迁移比突变更有效地改变群体的等位基因频率。,现以决定Rh血型基因座上的R0为例说明基因流在人类群体中造成的后果设R0 基因频率在白人群体中的p 0.028,而在黑人的祖先群体中R0 的基因频率p0 0.630(或被视为黑人群体中的初始R0基因频率)。现已知,该国家中黑人的祖先来到这个国家大约为300年前(或以n 10代来表示),而已知黑人群体中的pn 0.446。将上述已知数据代入公式中:,说明从白人群体进入黑人群体的基因流动速率相当于每代平均3.6%。,四、遗传漂变在一个小群体内,由于抽样的随机误差所造成的群体中基因频率的随机波动,叫做遗传漂变(genetic drift)。由群体遗传学家S.Wright于1930年提出的,有时人们也把漂变称莱特效应(Wright effect)。,大群体中如果不产生突变,根据哈德魏伯格定律,不同基因型的频率将会维持平衡状态。在一个小群体中,由于小群体与其它群体相隔离,不能充分地随机交配,因而在小群体内基因不能达到完全自由分离和组合,使基因频率容易产生偏差。但这种偏差不是由于突变、选择等因素引起的。,一般群体愈小,就愈易发生遗传漂变作用。,建立者效应(founder effect)这是由少数个体的基因频率决定了它们后代中的基因频率的效应,是一种由为数不多的几个个体所建立起来的新群体所产生的一种极端的遗传漂变作用。,卟啉(pulin)症是一种血红蛋白的代谢障碍,其特征是尿液中排出过量的卟啉。卟啉是血红蛋白分子的主要组成成分。患者的皮肤见光部分容易起水泡和磨损。这种遗传病是由一个显性基因引起的。在世界的绝大多数地区此病极为罕见,其基因频率极低。但在南非的欧洲人群中约有41000的发病率。该致病基因的频率为何如此高?,人类群体遗传分析表明:是由于遗传漂变的建立者效应所致。对南非白种人卟啉症患者的家系进行仔细调查之后发现,大约有200万欧洲人的现代群体,他们都是1686年来到好望角市结婚的一对荷兰夫妇的后裔,这对夫妇中的一人是卟啉症致病基因的携带者。,瓶颈效应(bottle neck effect)由于环境的激烈变化,随机遗传漂变使群体中的个体数急剧减少,甚至面临灭绝的等位基因频率发生偶然变异,类似于群体通过瓶颈。当一个大群体通过瓶颈后由少数个体再扩展成原来规模的群体,这种由于群体数量的消长而对遗传组成所造成的影响称为瓶颈效应。,在自然界,当气候或其他环境条件变得十分严峻时,群体中的个体数目急剧减少,甚至面临绝灭危险时,通过瓶颈效应或建立者效应可以使它们的数量恢复到原来的大小。但在瓶颈期间,由于遗传漂变的作用在很大程度上改变了它们的基因频率,因而改变了重新恢复起来的群体中的基因频率。,第四节 自然群体中的遗传多态性,在一个群体中存在两个和多个有相当高频率(一般大于1%)的等位基因的现象,称为遗传多态性(geneticpolymorphism)。遗传多态性是由基因突变产生的,诸如核苷酸的置换、插入、缺失(或删除),以及基因转变和基因间的重组等。,一、多态性与杂合性,一个基因或一个表型特征若在群体内有多于一种的形式的话,它就是多态的基因或多态的表型。例如,用电泳法观测了海蠕虫的30个基因座,其中12个基因座上未发现变异,其余18个基因座上检出了变异,可以计算有18/30=0.60基因座在群体中是多态的,或者说群体多态性程度是60%。,群体的平均杂合度计算式为:H每个基因座为杂合体的频率总和基因座总数,例如在某群体中研究了4个基因座,每基因座上杂合子频率分别为0.25,0.42,0.09和0.00。对于这4个基因座而言,H(0.25 0.42 0.09 0.00)4 0.19,杂合性(度)(heterozygosity,H)是群体遗传变异的另一个度量参数。它是指某一基因座上的等位基因是杂合体的频率。,核型是一个物种的染色体的显著特征,许多物种在染色体数目与形态上有很高的多态性。相互易位和倒位等染色体结构变异引起的多态,在植物、昆虫甚至哺乳动物中都存在。,二、染色体多态性,三、蛋白质多态性,四、DNA多态性,群体遗传学分析常用下列标记:(1)限制性片段长度多态性(RFLP)(2)数目可变串联重复(VNTR)(3)短串联重复(SSR)(4)单核苷酸多态性(SNP),RFLP,D5S818基因座属于(AGAT)n 4核苷酸短串联重复,按其核心序列的重复数来命名其等位基因,即当核心序列AGAT重复次数n 7,8,9,15时,则分别命名为7,8,9,15等位基因。,第五节 物种形成,一、物种(Species)的概念物种:个体间实际上能够相互交配或具有相互交配的潜能而产生可育后代的自然群体,是生物分类的基本单元,生物繁殖和进化中的基本环节。,(总)界 动物界 门(亚)脊索动物门 纲(亚)脊椎动物亚门 目(亚)灵长目 科(亚)人科 属(亚)人属 种(亚)人种,二、物种形成的方式,1.渐变式 又称地理物种形成 在一个长时间内旧的物种逐渐演变成为新的物种,这是物种形成的主要形式。渐变式又可分为二种方式:继承式和分化式(1)继承式:指一个物种可通过逐渐累积变异的方式,经历悠久的地质年代,由一系列的中间类型过渡到新种。,分化式:指同一物种不同群体,由于地理隔离或生态隔离逐渐分化成不同新种。由少数种变为多数种。过程:地理隔离(如海洋、大片陆地、高山和沙漠等)许多生物不能自由迁移、相互之间不能自由交配、不同基因间不能彼此交流遗传变异自然选择变种或亚种进一步分化生殖隔离新种。,羚松鼠,2.爆发式又称量子式物种形成不一定需要悠久的演变历史,在较短时间内即可形成新种。一般不经过亚种阶段通过远缘杂交、染色体加倍、染色体变异或突变等方法在自然选择的作用下逐渐形成新种。,第六节 分子进化与中性学说,从生物学、分类学、胚胎学、比较解剖学、生物地理学、生理学和遗传学等领域可以证明生物进化的过程。,同样,也可以从分子水平研究生物的进化。根据生物核酸和蛋白质结构上的差异程度:精确估计生物种类的进化时期和速度;估计结构简单的微生物进化;比较亲缘关系极远类型之间的进化信息。,一、蛋白质进化,比较生物之间同一蛋白质的组成,根据蛋白质中氨基酸变化数目和各类生物相互分歧的时间对比,计算进化时蛋白质变化速率,估计其亲缘关系和进化程度。,有些蛋白质在各类生物进化中执行同一任务。例如:细胞色素C细胞色素C由104个氨基酸组成,是一种呼吸色素、在氧化代谢中担任转移电子的作用。,黑猩猩细胞色素C中的氨基酸和人完全一样,说明黑猩猩与人的亲缘关系较近。人陆生动物的亲缘关系较近,细胞色素C氨基酸差异无或很小;人水生动物的差异较多;人植物的差异很多;人微生物的差异最多。,细胞色素C的进化速率是0.310-9,可计算人类与其它物种的分歧时间:人恒河猴:约为0.16亿年;人兔子、猪、狗、马和企鹅等哺乳动物:约在23亿年;人蛾等昆虫:约在7亿年前;人酵母等真菌:约13亿年前。,二、核酸进化,在分子水平上探讨进化,需要直接分析遗传物质(核酸),而不是由核酸编码的蛋白质。核酸的分子结构中包含了极其丰富的进化信息。,1.DNA量的变化 一般生物由简单到复杂,DNA含量由少到多。分子遗传学表明:复杂生物种类要求更多的基因来传递和表达较为复杂的遗传信息。例如:噬菌体有9个基因、SV40病毒有610个基因,而“人类基因组计划”研究表明人(2n=46)染色体上约有34万个基因。,DNA含量不一定与生物的复杂程度成正比,因为许多生物体中存在着大量的DNA重复序列。如:肺鱼DNA含量几乎是哺乳动物的40倍;玉米DNA含量是哺乳动物的2倍。,2.用DNA差异估算分子的进化速率分子进化速率的计算方法(以氨基酸为例):,k是每年每个位点上的氨基酸置换率ln是自然对数d是氨基酸置换数n是所比较的氨基酸总数。T是不同物种进化分歧的时间,细胞色素C由104个氨基酸组成人猴:约为0.16亿年,不同物种众多的氨基酸分子进化速率计算结果表明:k值一般都在10-9,日本的木村资生(KimuraM.)建议将10-9定为生物分子进化钟的速率。如果已知进化速率(k),便可以估算不同物种进化分歧的时间:,三、分子进化的中性学说,1968年 日本学者木村资生(M.Kimura)分子进化的中性学说(neutral theory of molecular evolution):进化中大多数氨基酸和核苷酸的突变型的替换是由选择上呈中性或近中性的突变经随机固定所造成的。该学说主张:物种间分子水平上的遗传差异以及物种内的大多数变异,既不是由有利等位基因的正选择也不是由平衡选择所造成的,而是由选择上呈中性或近中性的突变基因的随机遗传漂变所固定的结果。,本章小结1.重要概念群体遗传学、孟德尔群体、基因库、基因频率、基因型频率、适合度、选择系数、遗传漂变、建立者效应、瓶颈效应、生殖隔离、物种等。2.基因频率和基因型频率的计算3.遗传平衡定律的内容及应用4.物种形成的方式5.分子进化的中性学说,