LECTURE 5 种下数据分析方法资料课件.ppt
《LECTURE 5 种下数据分析方法资料课件.ppt》由会员分享,可在线阅读,更多相关《LECTURE 5 种下数据分析方法资料课件.ppt(74页珍藏版)》请在三一办公上搜索。
1、种下数据分析方法Data Analysis at Intraspecies Level,黄原2010-3,主要内容,1.大进化与小进化的联系与区别2.用于种下研究的分子标记和数据类型3.种下遗传多样性和分化参数及应用4.种下系统发育分析及应用5.种界确定,1.大进化与小进化的联系与区别,进化模式不同,大进化=种上分类单元进化:树状分歧进化为主。种间由于生殖隔离和突变以及分歧导致有完全不同的基因型的固定,从而形成非重叠的基因库(non-overlapping gene pools)和相互的单系性(reciprocally monophyletic lineages)。小进化=种下进化:网状形式的
2、进化 种内群体内/间的个体因随机交配有发生重组的机会,从而使个体的基因谱系呈现网状关系(reticulating relationships=tokogeny)。,种间树状进化遗传分歧,种内网状进化遗传多态性,研究内容的区别,种下研究(1)群体遗传结构(population genetic structure)(2)群体分化(population subdivision)(3)谱系生物地理学(phylogeography)(4)分子进化动力(the forces of molecular evolution)(5)个体/群体/亚种系统发育关系(individuals/populations/s
3、ubspecies phylogenetic analysis)种上研究(1)种界确定(species boundary delimitation)(2)分类单元单系性检验(testing taxa monophyly)(3)系统发育关系重建(phylogenetic relationship among taxa)(4)性状进化(character evolution),研究方法的区别,采用分子标记不同 抽样策略不同(Sampling strategy)数据分析方法不同,Molecules and their useful rangesin phylogenetic relationship
4、s,Species Genera FamilyOrderClassDivisions,Spacersits,mt DNA,Nu rDNA,Taylor,et al.,1991,;more sufficient statistically significant results,;sufficient statistically significant results,2.用于种下研究的分子标记和数据类型,分子标记,SNPSSRRAPDAFLP,单核苷酸多态性SNP:single nucleotide polymorphisms,SNP是指由于单个核苷酸的变异所引起的DNA序列多态性。A sin
5、gle base change,occurring in a population at a frequency of 1%is termed a single nucleotide polymorphism(SNP).When a single base change occurs at 1%it is considered to be a mutation.,微卫星Microsatellites,Design primers to“flanking regions”,微卫星基因分型原理 Li(1998).,随机扩增多态性DNA RAPD:randomly amplified polymor
6、phic DNA,RAPD profile of DNA from 23 samples,AFLP:amplified fragment length polymorphism,Digestion of DNA with two enzymesLigation of adaptersPrimers complementary to adapters and to 3 region of some of the fragments,AFLP Gel,分子标记的性质,显示方式:共显性(codominant)标记可以识别所有的等位基因,包括杂合子和隐性等位基因。显性(dominant)标记只能识别显
7、性等位基因,无法区分杂合子和隐性等位基因的纯合子。座位数目:单座位(single locus)标记可以识别等位基因。多座位(multiple loci)标记一般无法识别等位基因。,遗传方式,父系遗传标记Y ChromosomeHaploid,none or little recombination1.91095.410 9 per site per year 母系遗传标记Mitochondrial DNAHaploid,none or little recombination3.5108 per site per year 双亲遗传标记nDNADiploid,undergoes recombi
8、nation,基因型与基因分型(genotype and genotyping),一个个体在某一座位上所拥有的一对等位基因类型被称作基因型(genotype)。检定个体在特定座位上的基因型的方法被称作基因分型(genotyping)。,单倍型与单倍型分型haplotype and haplotyping,单倍型是指在一条DNA上多态性的分子标记的不同等位基因之间的组合。单倍型分型:,单倍型分型方法,对于位于Y染色体或mtDNA以及男性X染色体上的任何标记,每种基因型均为单倍型。对于位于常染色体及女性X染色体上的标记,如果研究的座位为纯合子,则可以直接得到单倍型;如果研究的座位为杂合子,则得到2
9、个联合的单倍型。可以通过3种方法获得单倍型。,二倍体标记的单倍型分型方法,从二倍体的基因型推导单倍型的方法:等位基因分离法:等位基因特异性PCR;克隆法;体细胞杂交法。统计推论法:Clarck算法;最大似然法;贝叶斯法。家系分析法:,单倍型块Haplotype Blocks,染色体在一代代的传递中同源片段发生重组,多代之后祖先染色体片段的原有排布已被打乱。那些没有被重组打破的区域相互间被重组区域隔开,这些区域就是单倍型块。单倍型块的长度一般为3 92 kb。人类基因组的65%-85%是以单倍型块方式组织起来的.,识别单倍型的意义,构建基因树的基础识别致病基因理解重组和LD模式,单倍型的起源与进
10、化,位于Y染色体和mtDNA上的单倍体分子标记无重组,因而单倍型多样性仅仅是由于突变产生。二倍体分子标记的单倍型的起源有突变和重组二种原因。如果重组是随机发生的,则n个等位基因可以有2n种单倍型。任何2个标记之间发生重组的可能性取决于它们的相互距离和位置。不同座位的等位基因之间由于重组降低而导致的association称为连锁不平衡(linkage disequilibrium,LD)。,3.种下遗传多样性和分化参数及应用,物种遗传变异程度的度量,测量遗传变异参数的方法随所研究标记的类型和遗传方式而异。一般地,物种的遗传变异可以从三个方面来描述:遗传多样性:遗传变异的量遗传分化:遗传变异在群体
11、之间的分布遗传距离:遗传变异在成对群体之间的数量。,遗传多样性,遗传多样性通常用于描述生物学实体(个体,群体和物种)内存在的遗传变异。杂合度和多态性水平是2个在个体、群体和物种3个水平上定量描述多样性的参数。广义的多样性包括2个组分:丰富度(richness)和均匀度(evenness)。前者测量变异的数量,后者指示变异的分布。,等位基因丰富度的测量,1 等位基因多样性(allelic diversity)或丰富度(allelic richness):每个座位上出现的等位基因数量的平均值。计算时也包括单态座位。可以以群体或物种为单位计算。2 多态座位百分数:当一个座位上最常见的等位基因的频率0
12、.95时该座位称多态座位。多态座位的定义是人为的,在当代文献中,只要表现出任何水平的变异就认为是多态座位,而并不特别强调0.95或0.99的标准。3 多态座位的平均等位基因数(mean number of alleles per polymorphic locus):计算方法同上但不包括单态座位。4 平均观测杂合度(mean observed heterozygosity,Ho):在所观测的座位上杂合子的数量占所有检测座位的比例。该参数广泛用于二倍体生物的共显性标记中,显然,单倍体生物是无杂合性可言的。当用于多倍体生物时对数据的解释须十分谨慎。该参数对显性标记不适合,因为无法识别出杂合性的个体
13、。5 平均期望杂合度(Expected heterozygosity He),是根据哈温定律所估算的期望值:He=1/mPij(1-Pij)M:基因座总数N:各基因位上的等位基因数Pij:第i个基因座的第j个等位基因的频率。,Neis基因多样性参数(gene diversity statistics),基因多样性首先由Nei(1973)提出,通常被看作是期望杂合度(expected heterozygosity)。Nei(1973)提出的基因多样性的计算:HT为总的期望杂合度,p为k个等位基因中的第i个在所有群体中的平均频率。基因多样性被广泛使用,但该参数也存在缺陷。如其值在0-1之间变化,随
14、着一个座位上的等位基因频率接近相等时,它变得不灵敏,此外,该参数严重依赖于2个最常见等位基因的频率。,单倍体基因组的考虑,单倍体基因组的标记在计算基因多样性参数时也用同样的方法,如计数单倍型的数目。对于单倍体标记独特的参数是计算单倍型多样性(haplotype diversity)。,群体遗传分化的度量,1 Neis GST 2 Wrights F-statistics,Neis GST,总遗传多样性(HT)是以期望的总杂合度来度量的。HT可以分解成存在于群体内部的基因多样性部分HS和存在于群体间的基因多样性的部分DST(Nei,1973)。即 HTHSDST HS为每一群体内的期望杂合度的平
15、均值,即 其中p为每个群体中第k个座位上的第i个等位基因的平均频率(在所有群体中的均值)。多样性指数HT、HS、DST可以用于计算遗传分化参数GST,GST定义为群体之间相对于群体混合后(即总群体)的基因多样性,Nei(1973)称为基因分化系数(coefficient of gene differentiation):GSTDST/HT GST值在01之间变化,当HTHS时 GST0,表示等位基因频率在所有群体中相同,群体之间没有遗传分化;当HS0时 GST1,亦即群体内部无变异,而每个群体都固定了不同的等位基因,因而群体达到了最大的分化,所有检测的变异都分布在不同的群体中。在动物中,活动哪
16、里强的鸟类的GST值是脊椎动物中最低的;同样能够飞行的昆虫是无脊椎动物中最低的。,Wrights F-statistics,多样性指数HT、HS也可以用于计算每个个体的平均观测杂合度HI,也可以用于F-统计值来分析群体的遗传结构。Wright描述的HT和HS分别是在假定处于哈代-温伯格平衡时的全部群体的总的期望杂合度和群体内的平均期望杂合度,因而Wright和Nei对HT和HS的定义是不同的,尽管他们二人所使用的符号和计算公式相同。Wright基于在个体、群体和总群体(total population)3个水平上的变异情况提出3种分析方法。,Wrights F-statistics,Wrigh
17、ts F-statistics,Wrights F-statistics,Wrights F-statistics,遗传距离的计算,Neis遗传距离Chord distanceJaccard相似系数核苷酸多样度,1.Average number of pairwise nucleotide differences between seqs.,2.Normalize to the length of the sequences(L),核苷酸多样度 nucleotide diversity,1.ACAGCATTAGCA2.ATAGCAATAGCT3.ATAGCAATACCT,(1/3)*(3+1+
18、4)=8/3(8/3)/12=0.222A pair of sequences are on average 22.2%different,Example:,#of pairs,#of differences between sequences,遗传数据的分析方法,多元分析方法 Multidimensional Scaling,MS Principal Components Analysis,PCA谱系生物地理学(phylogeography)分析 Genetic boundary analysis Spatial autocorrelation Nested cladistic analys
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- LECTURE 种下数据分析方法资料课件 数据 分析 方法 资料 课件
链接地址:https://www.31ppt.com/p-2167029.html