核酸蛋白质序列进化分析.ppt
《核酸蛋白质序列进化分析.ppt》由会员分享,可在线阅读,更多相关《核酸蛋白质序列进化分析.ppt(56页珍藏版)》请在三一办公上搜索。
1、第七章 分子进化与系统发育树,主讲人:胡银岗,西北农林科技大学农学院遗传教研组,分子系统学、古分子系统学古生物遗体、化石保存的三种信息:形态学信息化学信息(生物的代谢产物和一般的生物化学分子)遗传信息(保存的一级结构生物大分子,即基因产物或基因片段)分子系统学(Molecular Systematics):从生物大分子(氨基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统树(谱系)的形式表达出来。古分子系统学:利用古代DNA保留的遗传信息进行分子系统学研究,Darwin,Charles(1809-1882),The Origin of Species(1859),7.1 生物进化的分子基础,
2、经典的进化学方法,化石证据(Fossil)比较形态学证据(Comparative morphology)比较生理学证据(Comparative physiology),进化学的分子方法,普适性 由4种核酸组成 分子水平的进化表现为:DNA序列和氨基酸序列演化 可比较性 比较不同物种的有关DNA序列 建立DNA序列和氨基酸序列的演化模型(数学模型)(形态、性状的演化模型?)基因组编码信息的丰富 与形态、性状包含的信息相比,基因组序列包含更多、更复杂的信息结构,分子系统发育学Molecular Phylogenetics分子系统学Molecular Systematics,What can we
3、do for molecular evolution?序列比较:源于同一祖先DNA/氨基酸序列的两条DNA/氨基酸序列,考察二者的差异。序列差异:进化过程中分子突变的痕迹分子进化:以累计在DNA/氨基酸分子上的历史信息为基础,研究分子水平的生物进化过程和机制。,分子系统学为生物分类问题提供了许多崭新的见解。,生物进化的分子机制,基因突变,1、核苷酸替代、插入/缺失、重组2、基因转换,固定在生物个体以及物种内,遗传漂变,自然选择,传递给后代,产生新的形态、性状,分子系统学是研究进化机制的一个重要工具。,DNA序列的突变,性状改变,DNA分子的改变,核苷酸替代substitution,核苷酸缺失d
4、eletion,核苷酸插入insertion,核苷酸倒位invertion,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TCT TTG CTG Thr Ser Leu Leu,替代,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TAC TTT GCT G Thr Tyr Phe Ala,插入,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TAT TGC TG-Thr Tyr Cys-,缺失,Thr Tyr Leu LeuACC TAT TTG CTG,ACC TTT ATG CTG Thr Phe Met Leu,倒位,
5、核苷酸替代的几种分类,转换(transition)嘌呤 嘌呤嘧啶 嘧啶,颠换(transvertion)嘌呤 嘧啶嘧啶 嘌呤,在大多数DNA片段中,转换出现的概率高于颠换出现的概率。Why?,DNA序列突变对氨基酸序列的影响,同义(沉默)替代(synonymous/silent substitution)仍然为同义密码子的核苷酸替代如:TAT TAC Tyr Tyr,非同义替代(nonsynonymous substitution)导致产生非同义密码子的核苷酸替代如:TAT AAT Tyr Asn,无义突变(nonsense mutation)导致产生终止密码子的核苷酸突变如:TAT TAA
6、Tyr STP,问题:假设所有密码子以同一概率出现,上述三种突变的比例?25%,71%,4%,密码子使用频率(codon usage),密码子使用频率的偏倚性:编码同一个氨基酸的多个同义密码子具有不同的使用频率,例:E.coli的RNA聚合酶 缬氨酸Val GTT GTC GTA GTG 55 21 34 34 精氨酸Arg CGU CGC CGA CGG 89 46 1 0,为什么会出现密码子使用频率的偏倚性?与同功能tRNA的丰度有关?突变压力与净化选择双重控制?,Open problem,拓扑结构:有根树:反映时间顺序无根树:反映距离,理论上,一个DNA序列在物种形成或基因复制时,分裂成
7、两个子序列,因此系统发育树一般是二歧的。一般考虑二歧的树结构:二歧树,分支:内部分支外部分支,节点:内部节点外部节点,7.2 系统发育树(Phylogenetic tree),考虑4个分类群时,共有15种可能的有根树,a,b,c,d,a,c,b,d,a,d,b,c,考虑4个分类群时,共有3种可能的无根树,系统发育树的种类基因树、物种树,物种树:代表一个物种或群体进化历史的系统发育树 两个物种分歧的时间:两个物种发生生殖隔离的时间 基因树:由来自各个物种的一个基因构建的系统发育树(不完全等同于物种树),表示基因分离的时间。,系统发育树的种类期望树、现实树和重建树,期望树:一个用无限长的序列或每一
8、分支的期望替代数构建的树,理论上:假设所研究的序列无限长,从中随机抽样进行统计分析。,实际情况:所研究的序列是短序列,统计得到的替代数目存在大量随机误差。,现实树:建立在实际替代数基础上的树,重建树,构树方法,系统发育树的构建,构建系统发育树的数据1、特征数据(character data):提供了基因、个体、群体或物种的信息2、距离数据(distance data)或相似性数据(similarity data):涉及的则是成对基因、个体、群体或物种的信息。距离矩阵,距离数据可以由特征数据计算得到。反之?,构造系统发育树的主要方法距离法 根据每对物种之间的距离直接计算得到。所生成的树的质量取决
9、于距离尺度的质量简约法 通过寻求物种间最小的变更数来完成的似然法 通过标准的统计推断建立系统发育的概率模型其它方法:神经网络方法、Hadamard结合法,构建系统发育树的主要过程1、拓扑结构的判别(从大量的拓扑结构中搜寻、判别)2、一个既定拓扑结构的分支长度的估计,最优原则,1、首先要获得所有分类群之间的进化距离。2、系统发育树的构建是基于进化距离之间的关系。,如何获得所有分类群之间的进化距离1、选定分类群共同的特征序列氨基酸序列、核苷酸序列 如:人、马、牛、袋鼠、蝾螈、鲤鱼的血红蛋白链的氨基酸序 列(140aa);人、猕猴、黑猩猩的线粒体DNA中细胞色素b基因的核苷酸序列(1,125bp);
10、2、比较两两序列之间的差异p;,7.3 系统发育树构建的距离法,3、根据不同的概率统计模型,由两条序列的差异p值构建它们的进化距离 氨基酸序列:PC(Poisson校正)距离、距离 核苷酸序列:Jukes-Cantor模型、Kimura模型、HKY模型等4、如何根据不同的概率统计模型,由两条序列的差异p值构建它们的进化距离方法1:UPGMA法(Unweighted Pair-Group Method using an arithmetic Average)谱系聚类,使用算术平均的非加权成组配对方法方法2:邻接法(Neighbor Joining Method),1、UPGMA法,UPGMA:(
11、Unweighted Pair-Group Method using an arithmetic Average,使用算术平均的非加权成组配对方法)Sokal&Michener(1958)Sneath&Sokal(1973),方法原理:谱系聚类,谱系聚类法的基本步骤首先将t个样本各自视为一类:得到初始的分类G(1)(含有t类),计算t个样本两两之间的距离,它们等价于初始的类间距离,得到初始的距离矩阵D(1);将距离最近的两类合并为一新类,得到新的分类G(2)(含有t-1类),并计算新类与其它类的类间距离,得到新的类间距离矩阵D(2),再按照最小距离准则并类,得到G(3)(含有t-2类)、D(3
12、),。直到所有样本都并成一类;画出谱系聚类图,决定分类的个数及各类的成员。,讨 论在基因替代速率恒定假设成立时,UPGMA方法比较适用;UPGMA方法适用于具有较小变异系数的距离测度;UPGMA是一种既构建拓扑结构又计算分支长度的方法;UPGMA方法既可以得到有根树,也可以得到无根树。,2、邻接法(Neighbor Joining Method),最小进化(ME)思想:在所有可能的拓扑结构中,选择分支长度和S最小作为最优树。(全局优化思想)(Edwards&Cavalli-Sforza,1963)Saitou&Nei(1987):在每一阶段应用最小进化原理,是ME方法的简化。,其中X为连接类群
13、i,j的节点,LiX为类群i到X的分支长度。,已知距离矩阵:6个分类群的距离矩阵dij,END,讨 论NJ法本质上是一种寻找最优拓扑结构的谱系聚类算法。同时给出系统发育树的拓扑结构以及分支的长度。优点:可以较快地构建系统树;适用于分析较大的数据集;能够较方便地进行自展(Bootstrap)检验。,MP算法基本思想(Fitch,1971;Hartigan,1973)考虑m个核苷酸(或氨基酸)序列(m 4),假定4种核苷酸(或20种氨基酸)可突变为与自身不同的任何一种。对于任一给定的拓扑结构,可以推断每个位点的祖先状态;对于该拓扑结构,可以计算出用来解释整个进化过程所需的核苷酸(或氨基酸)的最小替
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 核酸 蛋白质 序列 进化 分析
链接地址:https://www.31ppt.com/p-6301829.html