第七章分子系统发育分析 进化树课件.ppt
《第七章分子系统发育分析 进化树课件.ppt》由会员分享,可在线阅读,更多相关《第七章分子系统发育分析 进化树课件.ppt(114页珍藏版)》请在三一办公上搜索。
1、第七章 分子系统发育分析,姚正培 yao_,1,PPT课件,本章内容,引言生物进化的分子机制系统进化树及其构建分子系统发育分析软件及应用,2,PPT课件,引言,生物学家:We have a dream Tree of Life: 重建所有生物的进化历史并以系统树的形式加以描述,3,PPT课件,引言,梦想走进现实:How?最理想的方法:化石! 零散、不完整,4,PPT课件,引言,梦想走进现实:How?比较形态学和比较生理学:确定大致的进化框架 细节存很多的争议,5,PPT课件,引言,梦想走进现实:How?第三种方案:分子进化1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家
2、Linus Pauling提出分子进化理论基本假设核酸和蛋白质序列中含有生物进化历史的全部信息理论分子进化速率恒定。分子钟:物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系。 发生在分子层面的进化过程:DNA, RNA和蛋白质分子,6,PPT课件,引言,分子钟成立的证据:1、至少某些生物大分子(如珠蛋白)的进化速率在相当长的地质时间内的相对稳定、均匀;2、许多不同物种的多种同源大分子在相当长时间内的平均进化速率近似恒定。,7,PPT课件,建立分子钟的大致步骤1、选择所要比较的生物大分子种类 根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率大小
3、合适、分布范围能涵盖各待比较物种的生物大分子。2、选择所要比较的物种,确定各比较组合及其所代表的进化事件3、获得生物大分子一级结构的资料4、获得有关的代表性进化事件发生的地质时间数据5、通过比较大分子一级结构,选择合适的数学模型,计算得到进化产生的分子差异d,通过回归分析等统计方法得到大分子的进化速率r(t)6、由此可以推断未知进化事件的发生时间,8,PPT课件,Example: Molecular clock for 17 mammal speciesInferred pairwise nucleotide substitutions among 17 mammal species from
4、 seven gene products, as estimated from protein studies, plotted against date of divergence, as estimated from the fossil record. The line is drawn from the origin through the oldest point (marsupial / placental divergence at 125 MYBP). The strong linear relationship suggests that molecular differen
5、ces between pairs of species are proportional to the time of their separation, rather than the degree of organismal difference. Therefore, measures of genetic divergence can be used to date the time of divergence for species pairs for which no fossil data are available: genes function as Molecular C
6、locks. (from A. C. Wilson 1976),9,PPT课件,关于分子钟的讨论和争议1、对长期进化而言,不存在以恒定速率替换的生物大分子一级结构;(基因功能的改变、基因数目的增加)2、不存在通用的分子钟;3、争议: 分子钟的准确性 中性理论(分子钟成立的基础),10,PPT课件,第一节 生物进化的分子机制,分子途经研究生物进化的可行性分子进化的模式分子进化的特点研究分子进化的作用,11,PPT课件,分子途径研究生物进化的可行性,普适性由4种核酸组成 分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、蛋白质结构及功能的演化可比较性比较不同物种的有关DNA序列 建立DNA序
7、列的演化模型、氨基酸序列的演化模型蛋白质结构的演化模型基因组包含丰富的编码信息与形态、性状包含的信息相比,基因组序列、蛋白质序列包含更多、更复杂的信息结构,12,PPT课件,基因变异,1、核苷酸替代、插入/缺失、重组2、基因复制,固定在生物个体以及物种内,遗传漂变,自然选择,传递给后代,产生新的形态、性状,分子进化的模式,13,PPT课件,分子进化的模式,1. DNA突变:替代,插入,缺失,倒位核苷酸替代:转换 (Transition) & 颠换 (Transversion)2. 基因复制:多基因家族的产生以及伪基因的产生A. 单个基因复制 重组或者逆转录B. 染色体片断复制C. 基因组复制,
8、14,PPT课件,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TCT TTG CTG Thr Ser Leu Leu,替代,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TAC TTT GCT G Thr Tyr Phe Ala,插入,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TAT TGC TG- Thr Tyr Cys -,缺失,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TTT ATG CTG Thr Phe Met Leu,倒位,(1) DNA突变,15,PPT课件,核苷酸替代:转换
9、 & 颠换,1. 转换:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代2. 颠换:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代,16,PPT课件,(2)基因复制:单个基因复制,重组,逆转录,17,PPT课件,(2)基因复制:染色体片段复制,人,狒狒,18,PPT课件,(2)基因复制:基因组复制,S. Cerevisiae (酿酒酵母),K. Waltii (克鲁雄酵母),研究结果:克鲁雄酵母中的同源基因数量与酿酒酵母相比为1:2,19,PPT课件,分子进化的特点,生物大分子进化速率相对恒定 分子进化速率 生物大分子随时间的改变而变化,主要表现为核苷酸、蛋白质的一级结构的改变,即分子序列中核苷酸、氨基酸的替换 不同物
10、种同源大分子的分子进化速率大体相同 例子:比较不同物种血红蛋白氨基酸序列差异 人、马0.810-9/AA.a 人、鲤鱼0.610-9/AA.a 分子进化速率远远比表型进化速率稳定,20,PPT课件,生物大分子进化的保守性 保守性 功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功能上不重要的大分子或者大分子局部。 (引起表型发生显著改变的突变发生的频率要低于无明显表型发生显著改变得突变发生的频率。) 氨基酸 例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率是内区进化速率的10倍。 核苷酸 例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核苷酸替代频率较高。,2
11、1,PPT课件,研究分子进化的作用,从物种的一些分子特性出发,构建系统发育树,进而了解物种之间的生物系统发生的关系 tree of life; 物种分类大分子功能与结构的分析:同一家族的大分子,具有相似的三级结构及生化功能,通过序列同源性分析,构建系统发育树,进行相关分析;功能预测进化速率分析:例如,HIV的高突变性;哪些位点易发生突变?,22,PPT课件,研究分子进化的作用,Tree of Life: 16S rRNA,23,PPT课件,研究分子进化的作用,Out of Africa,53个人的线粒体基因组(16,587bp),人类迁移的路线,24,PPT课件,第二节 系统进化树及其构建,系
12、统进化树的概念系统进化树的种类系统进化树的构建,25,PPT课件,系统进化树的概念,所有生物都可以追溯到共同的祖先,生物的产生和分化就像树一样生长、分叉,以树的形式来表示生物之间的进化关系是非常自然的事。,26,PPT课件,系统进化树的概念,hylogenetic tree/evolutionary tree 系统进化树/生物进化树/系统发育树/系统发生树/系统树/进化树/演化树是表明被认为具有共同祖先的各物种相互间进化关系的树形图。,27,PPT课件,系统进化树的概念术语,祖先节点/树根,内部节点/分歧点,该分支可能的祖先节点,分支/世系:长度对应演化距离(如估计的演化时间),末端节点:代表
13、最终分类,可以是物种,群体,或者蛋白质、DNA、RNA分子等,A,B,C,D,E,28,PPT课件,系统进化树的概念,进化树分支的图像称为进化的拓扑结构理论上,一个DNA序列在物种形成或基因复制时,分裂成两个子序列,因此系统进化树一般是二歧的。,A,B,C,D,E,F,G,F,G,C,D,E,A,B,29,PPT课件,系统进化树的概念,直系同源(orthologs): 同源的基因是由于共同的祖先基因进化而产生的。旁系同源(paralogs): 同源的基因是由于基因复制产生的。用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。,旁系同源,直系同源,30,PPT课件,拓扑结构:有根树
14、:反映时间顺序无根树:反映距离,系统进化树的种类 有根树、无根树,外围支,31,PPT课件,考虑4个分类群时,共有15种可能的有根树,32,PPT课件,a,b,c,d,a,c,b,d,a,d,b,c,考虑4个分类群时,共有3种可能的无根树,33,PPT课件,#Taxa 无根树 有根树,3 1 34 3 155 15 1056 105 9457 945 10,39530 3.58X1036 2.04X1038,Taxa增多,计算量急剧增加,选出真实树的拓扑结构十分困难,因此,目前算法都为优化算法,不能保证最优解。,系统进化树的种类 有根树、无根树,34,PPT课件,系统进化树的种类 标度树、非标
15、度树,标度树:分支的长度表示变化的程度非标度树:分支只表示进化关系,支长无意义,一个单位,35,PPT课件,系统进化树的种类 物种树、基因树,物种树:代表一个物种或群体进化历史的系统进化树,两个物种分歧的时间为两个物种发生生殖隔离的时间基因树:由来自各个物种的一个基因构建的系统进化树(不完全等同于物种树),表示基因分离的时间。,36,PPT课件,系统进化树的构建,构建系统进化树的步骤构建系统进化树的方法构建进化树的一般原则,37,PPT课件,构建系统进化树的步骤,多序列比对(自动比对,手工校正),选择建树方法以及替代模型,建立进化树,进化树评估,38,PPT课件,构建系统进化树的方法,1. 最
16、大简约法 (maximum parsimony, MP)适用序列有很高相似性时2. 距离法 (distance)适用序列有较高相似性时3. 最大似然法 (maximum likelihood, ML)可用于任何相关序列集合计算速度:距离法 最大简约法 最大似然法,39,PPT课件,构建系统进化树的方法 最大简约法(MP),理论基础为奥卡姆 (Ockham)原则:计算所需替代数最小的那个拓扑结构,作为最优树在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树缺点:分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候
17、,可能会给出一个不合理的或者错误的进化树推导结果,40,PPT课件,信息位点能将所有可能的树区别出来的位点。至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点。,构建系统进化树的方法 最大简约法(MP),41,PPT课件,42,PPT课件,上例,1. Position 5, 7, 9为信息位点2. 基于position 5的三个MP树: Tree 1长度1,Tree 2 & 3长度23. Tree 1更为简约:总长:4 Tree 2长5;Tree 3长64. 计算结果:MP tree的最优结果为tree 1,43,PPT课件,构建系统进化树的方法 距离法,又称距离矩阵法,首先
18、通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系 。,44,PPT课件,构建系统进化树的方法 距离法,简单的距离矩阵,45,PPT课件,由进化距离构建进化树的方法有很多,常见有:(1) Fitch-Margoliash Method (FM法): 对短支长非常有效(2) Neighbor-Joining Method (NJ法/邻接法):求最短支长,最通用的距离方法(3) Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Met
19、hod (UPGMA法/非加权组平均法),构建系统进化树的方法 距离法,46,PPT课件,DE距离=d+e (1)D到ABC间的平均距离=d+m (2)E到ABC间的平均距离=e+m (3)(2)-(3)+(1)d=4,e=6,构建系统进化树的方法 FM法,47,PPT课件,C最接近DE!,分成三组:C, DE, 以及AB,构建系统进化树的方法 FM法,48,PPT课件,c+g+(e+d)/2=19 (1)c+f+(a+b)/2=40 (2)(e+d)/2+(a+b)/2+f+g=41 (2)(1)+(2)-(3)得:c=9,构建系统进化树的方法 FM法,49,PPT课件,c+g+(e+d)/
20、2=19(e+d)/2=5,c=9,则g=5,构建系统进化树的方法 FM法,50,PPT课件,由:(a+b)/2+f+g+(d+e)/2=41 得:f=20由:a+f+c=39 得:a=10,则b=12,构建系统进化树的方法 FM法,51,PPT课件,1. 最大似然法(maximum likelihood, ML): 最早应用于对基因频率数据的分析上2. 选取一个特定的替代模型来分析给定的一组序列数据,在每组序列比对中考虑每个核苷酸替换的概率。例如,转换出现的概率大约是颠换的三倍。在一个三条序列的比对中,如果发现其中有一列为一个C,一个 T和一个 G,我们就认为,C和 T所在的序列之间的关系很
21、有可能更接近。3.计算表示序列关系的每棵可能的树的概率。 概率总和最大的那棵树最有可能是反映真实情况的系统发生树。 4. 缺点:费时,每个步骤都要考虑内部节点的所有可能性5. 改进:启发式算法,构建系统进化树的方法 最大似然法(ML),52,PPT课件,构建系统进化树的原则,53,PPT课件,1. 可靠的待分析数据2. 准确的多序列比对3. 选择合适的建树方法:A. 序列相似程度高,MP首先B. 序列相似程度较低,ML首先C. 序列相似程度太低,无意义4. 一般采用两种及以上方法构建进化树,无显著区别可接受,构建系统进化树的原则,54,PPT课件,1. 选择一个或多个已知与分析序列关系较远的序
22、列作为外围支2. 外围支可以辅助定位树根3. 外围支序列必须与剩余序列关系较近,但外围支序列与其他序列间的差异必须比其他序列之间的差异更显著,构建系统进化树的原则,选择外围支,外类群,55,PPT课件,进化树的可靠性分析,单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。最常见的就是bootstrap评估。,56,PPT课件,从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列;重复上面的过程,得到多组新的序列;对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性。至少进行1
23、00次重复取样。,进化树的可靠性分析自举法(Bootstrap Method),57,PPT课件,进化树的可靠性分析自举法(Bootstrap Method),58,PPT课件,59,PPT课件,第三节 分子系统发育分析软件及应用,常用分子系统发育分析软件分子系统发育分析实例(实验三),60,PPT课件,常用分子系统发育分析软件,61,PPT课件,常用分子系统发育分析软件,62,PPT课件,常用分子系统发育分析软件,进化分析软件PHYLIP:由华盛顿大学遗传学系开发,是一个免费的系统发育分析软件包,可以通过以下地址下载,目前已更新至3.69版。http:/evolution.genetics.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章分子系统发育分析 进化树课件 第七 分子 系统发育 分析 进化 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1605552.html