第二章数量遗传学基础ppt课件.ppt
第二章 数量遗传学基础,第一节 群体的遗传结构,第二节 数量性状及其遗传基础,第三节 亲属间相关分析,第四节 数量性状参数分析,数量遗传学的形成过程,数量遗传学基础,数量遗传学研究内容,数量性状的数学模型和遗传参数估测选择理论和方法交配系统(近交和杂交)的遗传效应分析育种规划理论基因频率和基因型频率通径系数,数量遗传学基础,数量性状遗传规律的研究步骤,建立数量性状遗传关系的数学模型根据资料检验模型的正确性估计模型参数,即遗传参数检验参数估计的可靠性结合实际作出参数的生物学解释应用模型解决实际育种问题,数量遗传学基础,例:,研究公猪(s)和饲养水平(r)及其互作效应对猪日增重的影响。首先建立观测值的数学模型:,第 公猪在第 饲养水平下的第 个后代的日增重,对数量遗传学研究内容的几点认识,统计学思想贯穿数量遗传学的全部内容,如遗传参数估计和育种值的预测等。确定性与不确定性的矛盾时时体现,遗传参数和育种值是真实存在的,但只能通过样本来推断总体,通过表型值来预测育种值。研究对象在个体与群体间相互转换遗传与变异的矛盾,数量遗传学基础,数量遗传学研究现状及发展前景,数量性状遗传基础理论方面遗传参数估计的方法方面选择理论和方法方面资料处理和计算手段方面宏观应用方面新知识和技术方法的应用方面,数量遗传学基础,第一节:群体的遗传结构,群体的遗传结构基因频率、基因型频率群体遗传平衡定律:HardyWeinberg定律群体遗传平衡定律的推广等位多基因、多基因座群体遗传结构的影响因素选择、突变、迁移、交配方式、遗传漂变,数量遗传学基础,基本概念群体,孟德尔群体(Mendelian population):个体间有交配的可能性、在连续世代间有基因交换的有性繁殖群体,其中的所有基因可看作是一个基因库,各个体共享这一基因库资源,相互间可自由地进行基因交流。一个个体在群体中存在的时间是有限的,除非发生突变,其遗传基础是终生不变的。一个群体则是可以长期存在的,群体可大可小、分布可广可窄,其遗传结构由所有个体的遗传基础决定,并受到各种各样的因素影响,可以随时发生变化。,数量遗传学基础,基本概念基因频率,基因频率(gene frequency):在一个群体中某一等位基因的数量与占据同一基因座的全部等位基因总数的比例。用百分率表示,取值范围在0到1之间,通常写成小数的形式,它是群体遗传特性的基本标志。,数量遗传学基础,基本概念基因型频率,基因型频率(genotype frequency):在二倍体的生物群体中,某一基因座的特定基因型在其全部基因型中所占的比例。用百分率表示,取值范围在0到1之间,通常也写成小数的形式,同一位点的所有基因型的频率总和为1,一般用大写字母表示。在只有一对等位基因(A和a)时,可形成三种基因型,即AA、Aa和aa,可用D、H和R分别表示各自的频率,这时 D+H+R=1。,数量遗传学基础,基因频率与基因型频率的关系,在一对基因时:AA基因型频率为D,有2D的A基因Aa基因型频率为H,有H的A和a基因aa基因型频率为R,有2R的a基因因此,A和a的基因频率分别为:,数量遗传学基础,实例,人类MN血型是由一对等位基因(M,N)控制,它们是共显性的,可形成三种基因型(MM、MN和NN),其抗原类型表现为M型、MN型和N型。通过对69685个人的抽测,发现M型有21045人、MN型有34378人、N型有14262人。试估计基因和基因型频率。,数量遗传学基础,因为基因型与所测的抗原类型一致,因此这三种基因型频率D、H和R分别为:,M和N的基因频率分别为p和q:,数量遗传学基础,基本概念随机交配,随机交配(random mating),其基本含义是指在一个有性繁殖的群体中,任何个体与所有异性个体都有相同的交配机会,即任何一对异性个体的结合都是随机的。,数量遗传学基础,群体遗传平衡定律Hardy-Weinberg定律:,在随机交配的大群体中,若没有选择、突变、迁移等因素的作用,基因频率和基因型频率在世代间保持不变。在任何大群体中,不论初始基因频率如何,只要经过一个世代的随机交配,一对常染色体上的基因就可达到平衡状态,没有其它因素影响时,其基因频率和基因型频率在以后的连续世代随机交配情况下保持平衡状态。在平衡状态下,一对等位基因的基因频率与基因型频率的关系为:,数量遗传学基础,Hardy-Weinberg平衡,一对等位基因时的亲本交配类型和后代基因型频率,数量遗传学基础,一世代的基因型频率和基因频率分别为:,数量遗传学基础,群体遗传平衡的统计检验,数量遗传学基础,群体遗传平衡定理的推广,一对等位基因无显性或显性不完全一对等位基因完全显性性连锁基因复等位基因多基因座,数量遗传学基础,一对等位基因完全显性,可以识别的隐性纯合子基因型频率等于,而p=1-q,从而很容易的确定群体的基因频率。,数量遗传学基础,例子:在奶牛中有角与无角是由一对等位基因控制的,无角是显性的。据某牛场统计表明,约有2的牛是无角的,试计算基因频率。,性连锁基因,性连锁基因与基因型频率,数量遗传学基础,数量遗传学基础,数量遗传学基础,性连锁基因频率在群体中的变化,数量遗传学基础,复等位基因,基因频率与基因型频率的关系为:,数量遗传学基础,实例,控制兔毛色有三个等位基因(C、ch、c),C对后两者显性,ch对c显性,只要有C基因就表现为有色,chch和chc表现为“八点黑”,即喜马拉亚白化(全身白色,耳、鼻、尾、脚为黑色),cc为白化(全身白色,眼球粉红)。据调查,在一随机交配的大兔群中,有色兔占75、“八黑”兔占9、白化兔占16,试估计三种基因频率。,数量遗传学基础,p1=0.5;p2=0.1;P3=0.4,加利福尼亚兔,公羊兔,喜马拉雅兔,在随机交配的大群体中,各种配子随机结合如下:,实例,人类的ABO血型系统由三个等位基因控制(IA、IB、IO),IA与IB是共显性的、并都对IO显性,因此呈现出四种血型,IAIA、IAIO为A型血,IBIB、IBIO为B型血,IAIB为AB型血,IOIO为O型血。据统计,某人群中A型血的比例为39、B型血为24、AB型血为12、O型血为25,试估计其基因频率。,数量遗传学基础,pA=0.3;pB=0.2;PO=0.5,群体遗传结构影响因素突变,偶发突变:不能以一定频率重复发生的偶然的一次突变频发突变:(recurrent mutation)是指能以一定频率重复发生的突变反向突变:将a基因突变为A基因称为反向突变(reverse mutation),研究表明反向突变率一般仅相当于正向突变率的十分之一左右,数量遗传学基础,频发突变,频发突变作用下第n代两基因的频率分别为:显然,如果没有其它因素影响,当n时,所有的A基因将变为a基因。,数量遗传学基础,反向突变,在正反向频发突变的作用下可以达到平衡,这时的基因频率为:t世代基因频率与世代数的关系如下:,数量遗传学基础,实例,设一对等位基因的初始频率分别为0.6和0.4,正突变率为810-5,反向突变率为210-5。试计算达到平衡状态时的基因频率?到第1000代时的基因频率?a基因频率由0.4升到0.6需要多少世代?,数量遗传学基础,结果,数量遗传学基础,迁移(migration):不同群体间由于个体转移引起的基因流动过程一代迁移后基因频率的变化量q为:经过t代连续迁移后的基因频率为:,群体遗传结构影响因素迁移,数量遗传学基础,群体遗传结构影响因素选择,选择(selection):群体内个体参与繁殖的机会不均等,从而导致不同个体对后代的贡献不一致。造成这种繁殖机会不均等的原因主要有个体适应性和生活力的差异、个体繁殖力不同及人为的选择,前两者是自然选择的主要因素,而人工选择是动物育种改良最重要的手段。适应度与选择系数对显性基因的选择对隐性基因的选择对杂合子的选择,数量遗传学基础,系统性因素的联合效应,突变与选择的联合效应迁移与选择的联合效应例子:假设正突变率为u=10-5,隐性基因的选择系数为s=0.1,试计算达到平衡时的基因频率和基因型频率?,数量遗传学基础,第二节:数量性状及其遗传基础,性状的分类 数量性状遗传基础 数量性状数学模型,性状的分类,质量性状(qualitative trait)变异可以截然区分为几种明显不同的类型,一般用语言来描述。如牛角的有无、毛色、血型等,通常作为品种特征。数量性状(quantitative trait)变异是连续的,个体间表现的差异只能用数量来区别。如日增重、体高、通常为畜禽的生产、生长性状。阈性状(threshold trait)呈非连续型变异,但是又不简单服从孟德尔遗传规律。如家畜对某些疾病的抵抗力表现为发病或健康两个状态。,性状的分类,质量性状、数量性状与阈性状的比较,数量性状遗传基础(1),微效多基因假说 数量性状是由大量的、效应微小而类似的、并且可加的基因控制,这些基因在世代相传中服从孟德尔原理,即分离规律和自由组合规律,以及连锁互换规律,这些基因间一般没有显隐性区别。此外,数量性状同时受到基因型和环境的作用,而且数量性状的表现对环境影响相当敏感。这一假说的实质是数量性状由大量微效基因控制,因而称之为微效多基因假说。有限的基因如何控制众多的数量性状?基因与性状的关系是“多因一效”和“一因多效”基因除具有加性效应外还有显性效应和上位效应 数量性状的表现还要受到环境的影响。,数量性状遗传基础(2),数量性状基因座将那些对数量性状有较大影响的基因座(单个的基因或基因簇)称为数量性状基因座(quantitative trait locus,QTL)。,作用可以利用分子遗传标记对数量性状基因型进行标记辅助选择;将转基因技术用于数量性状的遗传操作;能够鉴别由多因素引起的遗传疾病,为基因治疗和改进预防措施提供依据;对家畜育种实践的指导更为科学合理。,数量性状数学模型,数量性状表型值的剖分:,数量性状表型值(phenotype),基因型值(genotype),环境效应值(environment),基因型与环境互作效应(interaction),对于大多数的数量性状而言,基因型效应与环境效应之间无互作,或互作很小,一般都假设IGE=0,数量性状数学模型,数量性状表型值的剖分:,基因实际上存在有三种不同的效应,即基因加性效应(additive effect)、等位基因间的显性效应(dominance effect)和非等位基因间的上位效应(epistatic effect)。,在随机环境效应中,根据它对个体影响的情况可分为持久性环境效应和暂时性环境效应,从育种学角度出发,重要的是能够真实遗传的育种值这一部分,而D和I和带有一定的随机性,一般均将它们归并到环境效应偏差值中,统称为剩余值(residual),数量性状数学模型,基因效应和育种值 在具有等位基因A1和A2的基因座,假设纯合子A1A1的基因型值为+a,A2A2的基因型值为-a,杂合子A1A2的基因型值为d:,数量性状数学模型,基因效应和育种值,在一个随机交配的大群体中,A1和A2的频率分别为p和q,那么群体的平均基因型值()和基因型值方差()为:,公式的推导?,数量性状数学模型,基因效应和育种值 定义A1和A2基因的平均效应值分别为 和平均效应是指等位基因所形成的全部基因型均值与全群均值的离差。,育种值(breeding value)即为组成该基因型的两个等位基因的平均效应之和。因此:,数量性状数学模型,数量性状表型方差的剖分,由于有:,第三节 亲属间相关分析,亲属间的遗传相关亲属个体的基因来自共同祖先的概率。亲属间的表型相关 亲属间性状表型值间的相关系数。,数量性状的表型值取决于遗传和环境的共同作用,因而表型相关中即包含遗传相关,又可能包含有环境相关,共同环境效应,母体效应(maternal effect)全同胞个体,由于在妊娠、哺乳等阶段受到同一母体的营养水平、饲养管理、母亲个体间差异等的影响,表现出比非同胞间个体更为相似的现象。,共同环境一般能加大个体间的相似性,但也有可能削弱其相似性,如在限食饲养情况下,同一家系的个体可能由于采食竞争能力不同,从而加大了个体间的差异,降低了同胞家系内个体间的相似性。,其它因素,如栏舍、饲养人员等。,亲属间遗传协方差和近似遗传相关,亲属间遗传协方差,全同胞间近似遗传相关为0.5的推导:,是两个体的父系基因和母系基因为同源一致的概率。,关于通径分析(Path Analysis Wright,1921),通径分析是借助图解来阐明变量间相互关系的方法。动物育种中主要用来估计表型或遗传相关程度和计算近交系数以及亲缘系数。目的:变量之间相互因果关系确定下来后,就可以估计引起方差协方差来源(原因)的相对大小。,两个变量间的关系:因果关系:单箭头线,方向由因到果,称为通径线。平行关系:双箭头线,称为相关线。每条线的相对重要性称为系数。通径线的系数称为通径系数。相关线的系数称为相关系数。,如猪的屠宰体重(Y),由生长速度(X1)和4月龄体重(X2)决定,而它们又是由饲养条件(X3)决定。,关于通径分析,通径系数的实质就是标准化的回归系数,多数情况下,为标准化的偏回归系数。,1.通径系数下标中依变量在前,自变量在后,二者用点(.)分开。2.注意通径系数没有单位。只有两个变量时,通径系数等于相关系数。,关于通径分析,通径系数的性质(一),性质一(独立原因):dy.x1+dy.x2=1Py.x1=ry.x1,Py.x2=ry.x2如果原因不完全,则决定系数之和小于。决定系数是自变量到依变量的通径系数的平方,即dy.x=P2y.x。,根据方差剖分原理:,性质二(间接原因):Py.X3=Py.x1 Px1.x3,Py.x4=Py.x1 Px1.x4dy.x1=dy.x3+dy.x4,通径系数的性质(二),通径系数的性质(三),共同原因:ry1y2=P2 P2(左)ry1y2=rx2x3 P2 P3(中)ry1y2=P2 P 2+P3 P 3(右),通径系数的性质(四),ryx1=P1+r12 P2+r13 P3dy.x1+dy.x2+dy.x1x2=1,通径系数的性质(五),ry1y2=P2 P2+P3 P 3+P2 r23 P 3+P3 r23 P 2,通径链的追溯规则,通径方向,只能“先退后进”,不能“先进后退”。一条通径链最多只能改变一次方向。通过一条相关线等于改变一次方向邻近通径必须以尾端与相关线相接一条通径链内至多只能有一条相关线不同的通径链可以重复通过同一条相关线在追溯两个结果的通径链时要避免重复和遗漏。,第四节 数量性状参数分析,重复力或重复率(repeatability)衡量一个数量性状在同一个体多次度量值之间的相关程度的指标。环境效应持久性环境效应是指时间上持久或空间上非局部效应的环境因素对个体性状表现所产生的影响。暂时性环境效应是指暂时的或局部的特殊环境因素对个体性状的某次度量值产生的影响。,重复率,重复率估计的原理表型方差可以剖分为:,因此把重复率 定义为:,重复率实际上就是以个体多次度量值为组的组内相关系数,因而其估计方法与组内相关系数的计算完全一致,可利用单因素方差分析进行估计。重复率反映了一个性状受到遗传效应和持久性环境效应影响的大小。,第四节 数量性状参数分析,例:,组内相关系数?,重复率,重复率,重复率的作用重复率可用于验证遗传力估计的正确性 重复率可用于确定性状需要度量的次数,多次度量均值方差与单次度量值方差之间的关系为:重复率可用于种畜育种值的估计,第四节 数量性状参数分析,不同重复力时多次度量的相对准确度的变化曲线,见P39,遗传力,遗传力概念和估计原理 广义遗传力是指数量性状基因型方差占表型方差的比例实现遗传力是指对数量性状进行选择时,通过亲代获得的选择效果,在子代能得到的选择反应大小所占的比值狭义遗传力是指数量性状育种值方差占表型方差的比例,第四节 数量性状参数分析,4、遗传力是一个群体的遗传参数,是一个统计量,不是某一个体所具有的特征,个体有育种值、表型值,但个体没有遗传力。,遗传力的几个重要性质,1、遗传力是育种值对表型值的回归系数,即。证明如下:,2、育种值与表型值之间的相关系数,等于遗传力的平方根,即,3、表型方差中任何一个方差分量的变化,都能导致遗传力的改变。,7、遗传力的估计来自一个样本,因此有抽样误差。对同一样本采用不同 方法得到的结果可能有差异。这是由于同一种方法所得出的指标,其 含意和解释与另一种方法所得出的指标大不一样。这属于理论解释和 方法的适用性问题。,遗传力的几个重要性质,5、遗传力有群体特异性,同一性状在同一时间内在不同群体中 测定,遗传力的估计值的大小不同,差异的大小取决于群体的遗传结构和 环境条件。所以不同群体不能任意互相引用性状遗传力。,6、遗传力在同一群体中不是固定不变的。随着选择的不断进行,群体 内的遗传方差会逐渐减小,从而导致性状遗传力逐渐降低。这种现 象对于经过长期定向选育的高产品种或品系尤为明显。,遗传力,遗传力估计原理,两类个体表型值间的相关系数,两类个体育种值间的相关系数,即亲缘系数,遗传力估计方法,亲子资料估计遗传力,子女表型值对一个亲本的回归或相关估计,子女表型值对双亲均值的回归或相关估计,公畜内女母回归或相关估计,同胞资料估计 遗传力,半同胞组内相关法,全同胞组内相关法,遗传力,遗传力估计方法亲子资料估计遗传力子女表型值对一个亲本的回归或相关估计:,两类个体育种值间的相关系数,即亲缘系数,两类个体表型值间的相关系数,第四节 数量性状参数分析,亲子资料估计遗传力 子女表型值对一个亲本的回归和相关估计:,遗传力,遗传力估计方法亲子资料估计遗传力子女表型值对双亲均值的回归或相关估计:,第四节 数量性状参数分析,子女表型值对双亲均值的回归或相关估计:,子女表型值对双亲均值的回归或相关估计:,遗传力,遗传力估计方法 亲子资料估计遗传力公畜内女母回归或相关估计:,第四节 数量性状参数分析,遗传力,遗传力估计方法同胞资料估计遗传力 半同胞组内相关法:,第四节 数量性状参数分析,半同胞组内相关法,第四节 数量性状参数分析,半同胞遗传力估计方差分析表,遗传力,遗传力估计方法同胞资料估计遗传力 全同胞组内相关法,第四节 数量性状参数分析,理论上三个遗传力应该相等,但实际估计时存在偏差,一般以 为准,因为它是公畜组分和母畜组分估计的平均值。,遗传力的显著性检验,半同胞组内相关法,第四节 数量性状参数分析,全同胞组内相关法近似的可用方差分析的F检验,遗传力估计举例,统计某纯种地方猪种3头种公猪的仔猪肥育期平均日增重列于下表。用全同胞组内相关估计遗传力。,第四节 数量性状参数分析,遗传力估计举例,整理资料:按种公猪所配母猪分组,将仔猪日增重记录列成上表 计算平方和、自由度及、和,列方差分析表计算估计遗传力,第四节 数量性状参数分析,遗传力估计举例,第四节 数量性状参数分析,遗传力,影响遗传力估计的因素群体遗传结构和环境条件的改变,都会影响到性状遗传力本身 共同环境造成亲属间的环境相关亲本个体间的相关选择对遗传力的影响 配种方式对遗传力的影响 不同的遗传力估计方法 样本含量对遗传力估计有很大的影响,第四节 数量性状参数分析,遗传相关,遗传相关概念表型相关:是同一个体的两个数量性状度量值间的相关,由遗传相关和环境相关组成。,一类原因是由于基因的一因多效和基因间的连锁不平衡造成的性状间遗传上的相关。由基因连锁造成的遗传相关是不能稳定遗传的。但是由基因一因多效造成的遗传相关则是能够稳定遗传的。另一类是由于两个性状受个体所处相同环境造成的相关,称之为环境相关。在这两类遗传和环境相关原因的共同作用下,两个性状之间就呈现出一定的表型相关。,第四节 数量性状参数分析,遗传相关是描述不同性状之间由于各种遗传原因造成的相关程度大小,它不同于亲属个体间的遗传相关。,估计原理,家畜家禽中常见的表型、遗传和环境相关,畜种与性状 rP rA rE 奶牛:第一泌乳期产奶量与乳脂率-0.26-0.38-0.18 第一泌乳期产奶量与第二泌乳期产奶量 0.40 0.75 0.26英国大白猪:日增重与背膘厚 0 0.13-0.18 体长与背膘厚-0.24-0.47-0.01 日增重与饲料效率 0.66 0.69 0.64鸡:体重与蛋重 0.33 0.42 0.23 体重与产蛋量 0.01-0.17 0.08 蛋重与产蛋量-0.05-0.31 0.02,遗传相关,遗传相关估计方法 亲子资料遗传相关估计:,第四节 数量性状参数分析,遗传相关,遗传相关估计方法 同胞资料遗传相关估计:,第四节 数量性状参数分析,遗传相关,对某羊场的部分育成母羊的毛长(X)和剪毛量(Y)资料进行统计分析,得到下表的方差、协方差分析结果,并计算出。采用公畜内半同胞遗传相关估计两性状的遗传力和遗传相关。,第四节 数量性状参数分析,计算各方差和协方差组分毛长:剪毛量:毛长剪毛量:,第四节 数量性状参数分析,遗传相关,计算两性状的遗传力,第四节 数量性状参数分析,计算两性状的表型相关、遗传相关和环境相关,第四节 数量性状参数分析,遗传相关,遗传相关的三个主要作用 1、间接选择(indirect selection)即当对一个性状如X不能直接选择,或者直接选择效果很差时,借助与之相关的另一个性状如Y的选择,来达到对X选择的目的,性状Y就称之为辅助性状(assistant trait)。如对胴体性状、肉质性状、使用寿命和低遗传力性状等的选择。,第四节 数量性状参数分析,遗传相关的主要作用,2、不同环境下的选择 实际育种中,同一个体不同性状间可以估计遗传相关,而且同一个体在不同环境下的表现也可以作为不同的性状来估计遗传相关。3、多性状选择,