《序列比对》课件.ppt
《《序列比对》课件.ppt》由会员分享,可在线阅读,更多相关《《序列比对》课件.ppt(62页珍藏版)》请在三一办公上搜索。
1、第三章 序列比对,为什么要序列比对?,基于同源物鉴定的功能预测基本假设:序列的保守性 功能的保守性因为:1.蛋白质一般在三级结构的层面上执行功能;2.蛋白质序列的保守性决定于其编码DNA的保守性。,序列比对中的进化假设,1.所有的生物都起源于同一个祖先;2.序列不是随机产生,而是在进化上,不断发生着演变;3.基本假设:序列保守性 结构保守性注意:反之并不为真。结构保守性 序列保守性,contents,3.1 概述3.2 两条序列比对方法3.3 多条序列比对方法,3.1 概述,3.1.1 序列比对的概念3.1.2 生物序列之间的关系,序列比对(Sequence alignment),序列比对是序
2、列相似性分析的常用方法,又称序列联配。通过将两个或多个核酸序列或蛋白序列进行比对,显示其中相似的结构域,这是进一步相似性分析的基础。通过比较未知序列与已知序列的一致性或相似性,可以预测未知序列功能。,3.1.1 序列比对的概念,两条序列比对(pairwise alignment),通过比较两条序列之间的相似区域和保守性位点,寻找二者之间可能的进化关系。,多重序列比对(multiple alignment),不同物种中,许多基因的功能保守,序列相似性较高,通过多条序列的比较,发现保守与变异的部分2.可构建HMM模型,搜索更多的同源序列3.构建进化的树的必须步骤4.比较基因组学研究5.两类:全局或
3、局部的多序列比对,同源性和相似性,如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度问题。这两条序列之间要么是同源的,要么是不同源的。所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。同源蛋白质的氨基酸序列具有明显的相似性,这种相似性称为序列同源性。,同源性(homology),相似性(similarity),相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构与功能有什么联系。当相似程度高于50%时,比较容易推测检测序列和目标序
4、列可能是同源序列;而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。,直系同源和旁系同源,直系同源(orthology)是指不同物种内的同源序列,它们来源于物种形成时的共同祖先基因。(1)在进化上起源于一个始祖基因并垂直传递(vertical descent)的同源基因;(2)分布于两种或两种以上物种的基因组;(3)功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换;(4)结构相似;(5)组织特异性与亚细胞分布相似。,旁系同源(paralogy)基因是指同一基因组(或同一物种的基因组)中,由于始祖基因的加倍而横向/水平方向(horizontal)产生的几个同源基因
5、。即:旁系同源是基因复制的结果,两份拷贝在一个物种的历史上时平行演化的。这样的基因就被称为旁系同源基因。,直系同源和旁系同源,直系与旁系的共性是同源,都源于各自的始祖基因。其区别在于:在进化起源上,直系同源是强调在不同基因组中的垂直传递,旁系同源则是在同一基因组中的横向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定义上对功能上没有严格要求,可能相似,但也可能并不相似(尽管结构上具一定程度的相似),甚至于没有功能(如基因家族中的假基因)。,序列比对的数学模型,对序列从头到尾进行比较,试图使尽可能多的字符在同一列中匹配。适用于相似度较高且长度相近的序列如:Needleman-Wunsch
6、算法,全局比对,局部比对,寻找序列中相似度最高的区域,也就是匹配密度最高的部分。适用于在某些部分相似度较高,而其他部位差异较大的序列。如:Smith-Waterman算法,序列比对的数学模型大体可以分为两类,一类从全长序列出发,考虑序列的整体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。,局部相似性比对,局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。BLAST和FastA等常用的数据库搜索程序均采用局
7、部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。,3.2 两条序列比对方法,序列两两比对分析是最简单、最基本的对齐分析。三种方法:点阵分析法动态规划法:Needleman-Wunsch算法、Smith-Waterman算法词或K串法(BLAST or FASTA中应用),3.2.1采用Blast进行序列两两对齐分析3.2.2采用本地化软件进行两条序列比对,3.2.1 采用Blast进行序列两两对齐分析,Blast是一个局部比对搜索工具,用来确定一条查询序列和一个数据库的比对,最早的版本不引入间隙,但现在所用的版本已经允许比对中引
8、入间隙。“Bl2Seq”是NCBI上Blast程序的一部分,允许两条序列之行局部双序列比对,使用这个程序执行蛋白质(或DNA序列)的双序列比对非常容易。,网络服务如NCBI的“bl2seq”程序,地址:http:/blast.ncbi.nlm.nih.gov/Blast.cgi,点!,特殊BLAST,蛋白质序列比对用blastp,DNA序列比对用blastn,例:拟南芥和菠菜的抗坏血酸过氧化物酶基因的两两比对,粘贴sequence1,粘贴sequence2,竖线:一致性(identities),缺口(gap):不同之处,双序列比对的显著性:一致性百分比,核酸和蛋白质序列进行对库检索的结果中是否
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 序列比对 序列 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6235411.html