系统进化树构建方法与软件应用.ppt
《系统进化树构建方法与软件应用.ppt》由会员分享,可在线阅读,更多相关《系统进化树构建方法与软件应用.ppt(36页珍藏版)》请在三一办公上搜索。
1、系统进化树的构建方法与软件应用,姓名:张镜悬E-mail:J,什么是系统进化树,系统进化树又称为演化树,是表明被认为具有共同祖先的各物种间演化关系的树.在树中每个节点代表其各个分支的最近共同祖先,而节点的线段长度对应了其演化的距离。(http:/en.wikipedia.org/wiki/Phylogenetic_tree),直系同源和旁系同源,直系同源:同源的基因是由共同的祖先基因进化而产生的。旁系同源:同源的基因是由于基因复制产生的。这也就告诉我们用于分子进化分析中的序列必须是直系同源的才可以真实的反映其进化的过程。,系统进化树的分类,根据树是否有根,进化树可以分为有根树和无根树两类。,有
2、根树和无根树的进化层面上的意义,有根树反应了树上物种或者基因进化的时间顺序,通过分析有根树的长度,可以了解不同的物种或者基因以什么方式和速率进化。无根树只反映分类单元之间的距离,而不涉及谁是谁的祖先问题做有根树需要指定outgroup。所谓out group,就是你所分析的东西之外的一个group。比如你分析人类的不同人种,就选个chimpanzee,你要分析哺乳动物,就选个鳄鱼乌龟之类,总之保证它在 你要分析的group之外,但又不太远就行了。将你选定的东西指定为outgroup,做出来的树就是有根树。out group可以不只一个,它是一个group。,系统进化树的结构,node,bran
3、ch,进化树的结构主要分为三部分:树叶 树枝 节点其中我们把从同一个节点上分出的两个分支叫做sister group.Sister group 从结构上可以理解为从进化史上看两者非常接近,其次两者拥有唯一的共同的祖先。,系统进化树的结构,c,d,b,a,d,c,b,a,d,b,c,a,从结构上看,我们认为这三个树是等价的,构建系统进化树的理论方法,最大简约法(maximum parsimony,MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。最大简约法的理论基础是奥卡姆哲学原则,这个原则认为:解释一个过程的最好理论是所需假设数目最少的那一个。对所有可能的拓扑结构进行计算,并计算
4、出所需替代数最小的那个拓扑结构,作为最优树。优点:最大简约法对于分析某些特殊的分子数据如插入、缺失等序列有用。在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。缺点:在分析序列上存在较多 的回复突变或平行突变,而被检验的序列位点数又比较少的时候,最大简约法可能会给出一个不合理的或者错误的进化树推导结果。,构建系统进化树的理论方法,最大似然法(maximum likelihood,ML)最早应用于系统发育分析是在对基因频率数据的分析上,后来基于分子序列的分析中也已经引入了最大似然法的分析方法。当样本量很大的时候,似然法可以获得参数统
5、计的最小方差。最大似然法分析中,选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构 作为最优树。最大似然进化模型简单假设所有核苷酸(或者氨基酸)之间相互转变的概率是一样的程序会把所有可能的核苷酸轮流置于进化树的内部节点上,并且计算每个这样的序列产生实际数据的可能性。所有可能再现的几率被加总,产生一个特定点的似然值,然后这个数据集的所有比对位点的似然值的加和就是整个进化树的似然值。,构建系统进化树的理论方法,邻近法(Neighbor-Joining Method,NJ)该方法通过确定距离最近(或相邻)的成对分类单位来使系
6、统树的总距离达到最小。相邻是指两个分类单位在某一无根分叉树中仅通过一个节点(node)相连。通过循序地将相邻点合并成新的点,就可以建立一个相应的拓扑树。,构建系统进化树的所涉及的工具,PHYLIPMEGARMatlabBioEditTreeViewPHYMLClustalX,构建系统进化树的所涉及的工具,构建系统进化树的所涉及的工具,构建树,可以用PHYLIP或者MEGA构建MP树,可以使用PHYLIP或者MEGA构建ML树可以使用PHYML,速度快,同时构建ML树还可以用PHYLIP,或者可以使用BioEdit贝叶斯的算法以MrBayes为代表,不过速度比较慢关于系统发育分析的更多知识请参阅
7、:http:/,软件的选择,构建系统进化树的主要步骤,大体来说构建系统进化树的步骤有三步:序列比对(ClustalX2),构建系统进化树的主要步骤,2.掐头去尾 选取所需序列 转换格式(BioEdit or ClustalX2),Example:,3.利用相关软件绘制系统进化树(BioEdit,MEGA),实例讲解,下面的内容将教大家如何来构建自己的系统进化树。首先我们需要弄清楚一个很重要的问题,什么是Fasta 格式?,在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 进化 构建 方法 软件 应用

链接地址:https://www.31ppt.com/p-5752831.html