2数量遗传学基础.ppt
1,第二章 数量遗传学基础,2,第一节 数量性状的概念和特征,数量性状的概念生物的性状基本上可分为两大类:质量性状(qualitative trait)变异可以截然区分为几种明显不同的类型,一般用语言来描述;数量性状(quantitative trait)个体间性状表现的差异只能用数量来区别,变异是连续的。,4,阈性状(threshold trait):表现型呈非连续变异,与质量性状类似,但不是由单基因决定,性状具有一个潜在的连续型变量分布,遗传基础是多基因控制的,与数量性状类似。数量性状的特征区分性状的依据:性状是描述性的,还是可以度量的;性状是呈间断性分布,还是连续性分布;性状的表现是否容易受到环境的影响;控制性状的遗传基础是单基因还是多基因。,5,数量性状的特征数量性状在个体间的差异体现在量上或程度上,一般很难描述,需要度量;在一个群体中,数量性状变异呈连续性;数量性状受多基因控制;数量性状对环境影响敏感。,6,第二节 数量性状遗传的多基因假说,7,微效多基因假说(Nilsson-Ehle)主要论点如下:数量性状是由许多效应微小的基因控制;这些微效基因的效应相等且相加,故又称累加基因,在世代相传中服从孟德尔原理,即分离规律和自由组合规律,以及连锁互换规律;这些基因间一般没有显隐性区别;数量性状同时受到基因型和环境的作用,而且数量性状的表现对环境影响相当敏感。假说的实质数量性状由大量微效基因控制,8,有限的基因如何控制众多的数量性状?一般可以归结为下列三个原因:基因仅仅是性状表现的遗传基础,它与性状的关系并非是“一一对应”的,基因作用往往是多效性的,而控制一个性状的基因数目也很多。因此,基因与性状的关系是“多因一效”和“一因多效”的;基因作用实际上除了加性效应外,等位基因间还存在有显性效应,非等位基因间还存在有上位效应。这些非加性互作效应的存在,使得基因型间的差异更加难以区分;数量性状的表现不仅仅取决于基因型,而且不同程度地受到环境效应的影响。,9,数量性状基因座(QTL)对数量性状有较大影响的基因座称为数量性状基因座(quantitative trait locus,QTL),它是影响数量性状的一个染色体片段,而不一定是一个单基因座。,10,确定单个QTL基因主要有几个方面的作用:可以利用分子遗传标记对数量性状基因型进行标记辅助选择(marker-assisted selection,MAS)来提高家畜育种的效率,特别是对低遗传力性状和限性性状而言;将转基因技术用于数量性状的遗传操作;能够鉴别由多因素引起的遗传疾病,为基因治疗和改进预防措施提供依据;对这些QTL基因的数目和特性有所了解后,可以使数量遗传学理论建立在更加完善的基础上,对动物育种实践的指导更为科学合理。,11,数量性状数学模型数量性状表型值剖分 数量性状表型值(P)线性剖分为基因型值(G)和环境效应值(E)两个部分,即:P=G+E+IGE(2.5)IGE是基因型与环境的互作偏差效应值 假设,则在同一固定环境条件下可认为。影响数量性状表型值的环境效应,又可分为系统性环境效应(或称固定环境效应)和随机环境效应两类。随机环境效应又可分为持久性环境效应和暂时性环境效应。,12,基因存在有三种不同的效应,即基因加性效应(additive effect)、等位基因间的显性效应(dominance effect)和非等位基因间的上位效应(epistatic effect)。可以将基因型值剖分为育种值(A)、显性效应偏差值(D)和上位效应偏差值(I)三个部分。D和I带有一定的随机性,一般均将它们归并到环境效应偏差值中,统称为剩余值,记为 R。P=G+E=A+D+I+E=A+R(2.6)假设Cov(A,R)=0 或 rAR=0,13,14,如果是在一个随机交配的大群体中,A1和A2的频率分别为 p 和 q,那么群体的平均基因型值()和基因型值方差()为:若定义A1和A2基因的平均效应值分别为 和,则有:,(2.8),(2.7),15,基因的平均效应 是指该基因随机地与群体内的配子结合,所形成的全部基因型均值与全群均值的离差。基因替代的平均效应 两种基因的平均效应值之差,反应了用一种基因取代另一种基因的群体均值变化,记为,即有:,16,由此可以得到各种基因型的加性效应值,即育种值(breeding value)等于构成该基因型的两个等位基因的平均效应之和,分别为:,17,第三节 亲属间相关分析,18,亲属相关,有两类概念:一是亲属间的遗传相关二是亲属间的表型相关。亲属间的遗传相关 是从整体而言的,用亲属个体的基因来自共同祖先的概率计算,描述亲属间整体上的亲缘相关程度,与具体的性状没有关系。亲属间的表型相关 是描述亲属间性状表型值间的相关系数,由于只有特定的数量性状才有表型值,因此这种相关在不同性状、不同群体都是有所不同的。,19,共同环境效应母体效应(maternal effect)在妊娠、哺乳等阶段由母体的营养水平、饲养管理、个体间差异等对后代造成的影响。母体效应的影响分为两类:母体效应造成后代与母亲表现的相似性增加;母体效应造成同胞后代个体表现的相似性增加。,20,亲属间遗传协方差 造成亲属间遗传相关的根本原因是它们有共同来源的祖先。同源一致性(identity by descent,IBD)(Malcot,1948):指亲属个体带有的基因是由某一共同祖先同一基因复制而来的。遗传协方差的实际构成比较复杂,在忽略上位效应和基因连锁时,它由一系列加性效应和显性效应以及各种互作效应构成,即:,21,22,(2.12),23,同样地:因此,可以得到:若X和Y为父系半同胞,则=0。因此,对于半同胞有:,24,表2.2 亲属间遗传协方差和近似遗传相关,25,第四节 数量性状参数分析,26,定量描述数量性状遗传规律有三个最基本的遗传参数:重复力、遗传力和遗传相关重复力(repeatability)是衡量一个数量性状在同一个体多次度量值之间的相关程度的指标。对性状的终身表现产生的影响有:所有的基因效应 持久性环境效应 指时间上持久或空间上非局部效应的环境因素对个体性状表现所产生的影响。暂时性环境效应 一些暂时的或局部的特殊环境因素对个体性状的某次度量值产生影响,27,重复力估计原理从效应剖分看,可将环境效应()剖分为持久性环境效应()暂时性环境效应()两部分,因此假定基因型效应、永久性环境效应和暂时性环境效应之间都不存在相关,可以将表型方差()剖分为:故重复力 可定义为:,28,重复力的作用重复力可用于验证遗传力估计的正确性重复力可用于确定性状需要度量的次数 假设一个个体度量了 次,用这些度量值的平均数作为该个体的平均表型值,记为,可以得到多次度量均值方差与单次度量值方差的关系为:当度量次数无穷大时,多次度量可以提高度量准确性的极限值为,因此以它为基础,多次度量可以提高的度量准确性效率()为:,(2.14),(2.15),29,图2.4 不同重复力时多次度量的相对准确度(,图2.4 不同重复力时多次度量相对准确度(Q)的变化曲线 重复力可用于种畜育种值的估计,30,遗传力遗传力概念和估计原理广义遗传力 指数量性状基因型方差占表型方差的比例,它反映了一个性状受遗传效应影响有多大,受环境效应影响多大。实现遗传力 指对数量性状进行选择时,通过亲代获得的选择效果,在子代能得到的选择反应大小所占的比值,这一概念反映了遗传力的实质。,31,32,图2.5 遗传力估计原理通径图,33,依据通径分析原理之一,即两个变量间的相关系数等于连接它们的所有通径链系数之和,而各通径链系数等于该通径链上的全部通径系数和相关系数之乘积。因此,假定不存在共同环境效应,和 的相关系数 等于,由此可得到遗传力为:式中,是两类个体育种值间的相关系数,即亲缘相关系数。,(2.18),34,遗传力估计的基本方法利用亲子资料估计遗传力利用亲子资料估计遗传力一般有下列三种情况:子女表型值对一个亲本的回归或相关估计 在随机交配情况下,亲子间的亲缘系数近似等于0.5,假设 表示单亲(任何一个亲本)表型值,表示子女表型值,可以得到利用简单回归或相关方法估计的遗传力为:,(2.19),35,36,37,38,(2.23),公畜内个体间的遗传关系必须完全一致,即不应有全同胞个体存在,否则会使组内变异减小,遗传力估计偏高;公畜间应无亲缘相关,否则有亲缘相关的公畜组的半同胞间一致性增加,导致公畜间变异下降,遗传力估计偏低。如满足上述条件,假设有 头公畜,每一头公畜有 个半同胞子女,其中第 个子女的表型值为,利用单因素方差分析方法得到表2.4的结果,是有效平均子女数,因此遗传力估计值为:,39,40,全同胞组内相关法 由表2.2可知,在近似条件下,全同胞个体间的亲缘系数为,将它代入(2.18)式可以得到:(2.24)这里,表示全同胞个体间的表型相关。一般通过二因系统分组方差分析估计出各方差组分来计算。这样的分析应满足下列条件:所有变异来源除公畜个体效应和母畜个体效应外,其余效应全部为随机误差效应,41,公畜间的母畜不交叉;母体效应不存在或很小,可以忽略不计。否则,全同胞间会因母体效应导致组内变异变小,遗传力估计偏高;不同公畜、母畜间均无亲缘相关,否则存在亲缘相关的两组间的全同胞个体一致性增加,导致组间变异或下降,遗传力估计偏低。假设有 头公畜,各配 头母畜,每头母畜有 个全同胞子女,其中第 个子女的表型值为,利用二因系统分组方差分析方法得到如表2.5的结果,、和 是相应的有效重复数,因此遗传力估计值为:,42,(2.25),43,显著性检验 用亲子资料估计遗传力时,显著性检验与普通的回归分析和相关分析一样;用半同胞资料估计时,遗传力的显著性检验可转化为组内相关系数的显著性检验。即:,(2.26),用全同胞资料估计时,可用方差分析的检验近似替代,或用组内相关系数的显著性检验替代。,44,为使估计的遗传力达到统计显著,一般都需要增加样本含量。在总样本含量一定的情况下,可以确定出近似的最宜家系数和家系大小。以半同胞资料估计遗传力为例,最宜家系大小为,由(2.25)式可以推算出不同遗传力大小时,检验达到显著所需的最低样本含量,如表2.6。,45,表2.6 半同胞资料遗传力估计显著所需最低样本含量,46,举例【例2.2】统计某纯种地方猪种 3头种公猪的仔猪肥育期平均日增重列于表2.7。用全同胞组内相关估计遗传力。整理资料 按种公猪所配母猪分组,将仔猪日增重记录列成表2.7。计算平方和、自由度及列方差分析表 如表2.8所示。计算遗传力,47,表2.7 仔猪肥育期平均日增重(g),48,表2.8 平均日增重的全同胞资料遗传力估计方差分析表,49,由此得到三个遗传力估计值分别为:,50,影响遗传力估计的因素 遗传力是性状、群体和环境三者特性的综合体现。因此,群体遗传结构和环境条件的改变,都会影响到性状遗传力本身。当遗传与环境存在互作效应时,的假设不能成立,由此会导致遗传力估计出现大的偏差。共同环境造成亲属间的环境相关,即 的假定不能成立,因此前述的遗传力各种估计方法均不能应用。造成亲属间环境相关最主要的是母体效应。不同性状的母体效应影响是不同的,如果它的影响很大,则不宜采用全同胞相关和女母相关等估计遗传力。,51,在前述各种遗传力估计方法中,实际上都假定了亲本个体间不存在亲缘相关。例如,女母相关或回归时的母畜间,公畜内女母相关或回归及同胞分析时的公畜间、母畜间和公母畜间,均不应存在有亲缘相关。但是这一假定在实际动物育种中是难以成立的。选择对遗传力的影响。从理论上讲选择将导致遗传基础一致性增强,即 下降,也下降。所以用于估计遗传力的资料应是由群体抽取的一个随机样本。然而,实际的估计资料,如全同胞和半同胞资料,它们的父母亲一般均是经过选留的。,52,配种方式对遗传力的影响。一般对于杂交而言,由于杂交亲本难以达到较强的遗传基础一致性,因而不宜采用这种资料估计遗传力。从效应上讲,近交个体对环境敏感,增大;而且近交导致群体分化,加大了群体变异,所以 也增加,相应地降低。不同的遗传力估计方法,其应用条件和估计准确度都有所不同。样本含量对遗传力估计有很大的影响。一般而言,参数的构成愈复杂,其估计愈难达到统计显著,需要的样本含量也愈大。,53,遗传相关遗传相关概念和估计原理表型相关(phenotypic correlation)就是同一个体的两个数量性状度量值间的相关。一般而言,造成这一相关的原因区分为两大类:一类是由于基因的一因多效和基因间的连锁不平衡造成的性状间遗传上的相关。另一类是由于两个性状受个体所处相同环境造成的相关,称之为环境相关(environmental correlation)。,54,在这两类遗传和环境相关原因的共同作用下,两个性状之间就呈现出一定的表型相关,用图2.6表示。,图2.6 不同性状表型相关的剖分,55,PX、PY、AX、AY和RX、RY分别表示性状和性状的表型值、育种值和剩余值;hX、hY和eX、eY分别表示两性状育种值到表型值的通径系数和剩余值到表型值的通径系数;re(XY)和 r(XY)分别表示两性状的环境相关和遗传相关。假定各种育种值与剩余值间均不相关,那么根据通径分析原理可以将表型相关剖分为两部分,得到:,(2.27),56,遗传相关估计方法利用亲子资料遗传相关估计 设PX、PY和OX、OY分别表示亲代和子代X、Y两性状的表型值,假定亲子间的同一性状无环境相关,那么这两个性状间的遗传相关可以用下面两个公式计算:,(2.28),57,(2.29),58,经过整理资料,计算平方和、乘积和及自由度等步骤,已得到相应的方差和协方差分析结果,如表2.9。计算各方差和协方差组分:毛 长:,剪毛量:,,59,表2.9 育成母羊的毛长和剪毛量方差、协方差分析表,毛长剪毛量:,60,计算两性状的遗传力:,计算两性状的表型相关、遗传相关和环境相关:,61,遗传相关的主要作用间接选择(indirect selection)指当对一个性状(如X)不能直接选择,或者直接选择效果很差时,借助与之相关的另一个性状(如Y)的选择,来达到对选择的目的,Y 性状就称之为辅助性状(assistant trait)。不同环境下的选择 用于比较不同环境条件下的选择效果。多性状选择 遗传相关在选择指数理论中具有重要的作用,这是遗传相关最主要的用途。,