蛋白质序列分析.ppt
《蛋白质序列分析.ppt》由会员分享,可在线阅读,更多相关《蛋白质序列分析.ppt(70页珍藏版)》请在三一办公上搜索。
1、蛋白质序列分析,胡松年 2005 基因表达序列标签(EST)数据分析手册第八章吴祖建等 2011 生物信息学分析实践第五章,蛋白质序列结构信息蛋白质序列的基本性质分析结构域分析及motif搜索蛋白质二级结构蛋白质三级结构,蛋白质序列分析,一、蛋白质序列的基本性质分析,理化性质分析疏水性分析跨膜区分析信号肽预测Coil区分析亚细胞定位,蛋白质序列分析,蛋白质理化性质分析,Protparam 工具 http:/计算以下物理化学性质:相对分子质量 理论 pI 值氨基酸组成 原子组成消光系数 半衰期不稳定系数 脂肪系数总平均亲水性,蛋白质序列分析,主要选项/参数,序列在线提交形式:如果分析SWISS-
2、PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列,蛋白质序列分析,输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段,输出结果,蛋白质序列分析,点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果,蛋白质序列分析,蛋白质序列分析,ProtScale工具 http:/氨基酸标度表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等收集50多个文献中提供的氨基酸标度默认值为Hphob.Kyte&Doolittle,做疏水性分析,蛋白质疏水性分析
3、,蛋白质序列分析,20种氨基酸的疏水K-D标度,主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列,蛋白质序列分析,输出结果输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段,蛋白质序列分析,点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果蛋白质序列疏水区域分布预测图,蛋白质序列分析,跨膜区分析,膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构膜蛋白跨膜区可能作为膜受体,也可能是定位在膜上的锚定蛋白或
4、离子通道蛋白预测跨膜螺旋主要基于已知的跨膜螺旋信息,应用统计模型或神经网络方法使用单一的预测软件准确性不太高,综合不同的软件预测结果并结合疏水性图,可以获得较好的预测,对于跨膜螺旋和膜向性预测准确率达80%95%,蛋白质序列分析,跨膜区在线分析工具,蛋白质序列分析,跨膜蛋白数据库Tmbase来源于Swiss-Prot数据库,提供如跨膜结构区的数量、位置及其侧翼序列等信息。数据库下载地址:,跨膜区实例分析,蛋白质序列分析,使用TMHMM server 2.0对水稻瘤矮病毒(RGDV)外层衣壳 P8蛋白进行跨膜区分析。TMHMM基于隐马尔可夫模型预测,综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白
5、拓扑学限制等性质,可对跨膜区及膜内外区进行整体预测。TMHMM在区分可溶性蛋白和膜蛋白方面尤为见长,常用于判定一个蛋白是否为膜蛋白。,18,贴入RGDVp8.txt蛋白质序列,19,P8蛋白的1405位氨基酸位于细胞膜表面406425位氨基酸形成一个典型的跨膜螺旋区,信号肽预测,蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要通过内质网膜进入内质网腔内,最终成为分泌蛋白。分泌蛋白的N端都有一段约1535个氨基酸的疏水性肽段,其功能是引导蛋白质多肽链穿过内质网膜进入腔内,称为信号肽(signal peptide)。按照氨基酸组成及其位置特征,可将信号肽分为4大类:分泌信号肽 2.脂蛋白信号肽3
6、.Pilin-like信号肽4.细菌素和细菌素信号肽,蛋白质序列分析,信号肽主要由三个domain组成:N-region、H-regin和C-region.N-region为正电荷区域,至少含有一个精氨酸(R)或赖氨酸(K).H-region为疏水核,一般长为1214个氨基酸.C-region包含信号肽酶(SPase)的剪切位点,在剪切位点的-1位和-3位上多为中性的丙氨酸,该区域也称为富含丙氨酸区域.N H C N端 C端,蛋白质序列分析,信号肽预测在线分析工具,蛋白质序列分析,水稻条文病毒NSVc2蛋白信号肽预测,蛋白质序列分析,SignalP 3.0 Server主页NSVc2序列输出结
7、果:C score:剪切位点分值S score:信号肽分值Y score:综合剪切位点分值综合两种算法,NSVc2含有信号肽序列,为MHFKSYFIYTTIFNMAWG,说明NSVc2蛋白可能在跨膜运输中起信号识别作用剪切位点位于第1819位氨基酸,表明成熟肽始于第18位氨基酸,Coil区分析,卷曲螺旋(coiled coil)是蛋白质中由27条螺旋链缠绕成麻花状结构的总称。卷曲螺旋是控制蛋白质寡聚化的元件,含有卷曲螺旋结构的蛋白质主要是一些转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。七肽重复区(heptad repea
8、t,HR)是典型的卷曲螺旋结构类型之一,由多个七肽单元连接而成的重复序列,每个重复序列中的7个氨基酸残基依次用a-b-c-d-e-f-g表示。,蛋白质序列分析,a、d位多为非极性疏水氨基酸,位于卷曲螺旋结构的内侧;e、g多为极性带电氨基酸,与a、d位残基相互作用形成疏水核心的外侧。a、d、e、g位置上的氨基酸对于整个卷曲螺旋结构的稳定性及特异性具有重要作用。COILS Server:http:/根据卷曲螺旋蛋白结构数据库和包含球状蛋白序列的PDB次级数据库,可计算出目的序列形成卷曲螺旋的概率。使用COILS Server对RGDV P2蛋白卷曲螺旋预测分析。,蛋白质序列分析,已有文献研究表明,
9、RDV的P2蛋白含有一个 N 端的疏水肽、两个七肽重复区和一个跨膜区。RGDV P2蛋白与RDV P2蛋白在病毒粒体中位置相同、大小相似,具有高度保守的氨基酸序列和相似的一级结构,表明两者可能具有相似的结构。使用COILS Server分析RGDV P2是否由七肽重复区。COILS Server网页MTK:根据肌球蛋白、原肌球蛋白和角蛋白得到的打分矩阵MTIDK:由肌球蛋白、原肌球蛋白、中间纤维类蛋白、桥立蛋白和角蛋白得到的打分矩阵,蛋白质序列分析,COILS_20424_6595.txt,亚细胞定位,亚细胞定位与蛋白质的功能存在着密切的联系通过氨基酸组成进行亚细胞定位主要基于如下原理:不同的
10、细胞器多具不同的理化环境,根据蛋白质的结构及表面理化特征选择性容纳蛋白蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成,蛋白质序列分析,亚细胞定位预测步骤:抽取一个高质量的亚细胞定位数据集并分为训练集和测试集从选取的蛋白质数据中抽取出特征信息选择合适的算法预测用测试数据集对预测结果进行评价,蛋白质序列分析,常用的亚细胞定位在线工具,蛋白质序列分析,使用TargetP对RSV NSVc2蛋白进行亚细胞定位TargetP是预测真核蛋白亚细胞定位软件,主要基于叶绿体转运肽(chloroplast transit peptide,cTP)、线粒体导肽(mitochondr
11、ial targeting peptide,mTP)及分泌通路信号肽(secretory pathway signal peptide,SP)的N端序列进行预测预测结果:蛋白NSvc2的分泌途径为“-”型,即定位到其他细胞器。,蛋白质序列分析,二、蛋白质结构域及motif搜索,结构域分析Motif搜索,蛋白质序列分析,结构域分析,结构域(structure domain)是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。结构域通常由25300个氨基酸组成,不同蛋白质结构域数目或
12、同一蛋白质结构域相似度差异较大,蛋白质序列分析,常见的结构域主要有5种:全平行结构域反平行结构域+结构域/结构域其他折叠类型结构域是蛋白质的功能、结构和进化单元,结构域分析对于蛋白质结构的分类和预测有着重要作用。,蛋白质序列分析,结构域分析工具及数据库,蛋白质序列分析,使用SMART(Simple Molecular Architecture Research Tool)分析RGDV P8蛋白的结构功能域。两种搜索模式:常规模式和基因组模式在常规模式下粘贴RGDV P8序列,选PFAM domain,蛋白质序列分析,预测结果:第1426位是个高度保守的结构功能域Phytoero_P8,该结构域
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 序列 分析
链接地址:https://www.31ppt.com/p-5835407.html