从质谱数据鉴定多肽和蛋白质ppt课件.ppt
《从质谱数据鉴定多肽和蛋白质ppt课件.ppt》由会员分享,可在线阅读,更多相关《从质谱数据鉴定多肽和蛋白质ppt课件.ppt(68页珍藏版)》请在三一办公上搜索。
1、第三讲从质谱数据鉴定多肽/蛋白质,中科院自动化所 李伏欣,开场白,在之前的讲座中,我们已经学到了关于蛋白质组学中的重要工具质谱仪的知识。蛋白质组学里,质谱仪的作用是鉴定混合物中的蛋白质。然而,没有数据分析的辅助,它是做不到这一点的。,蛋白质鉴定的全流程,Sample,?,讲座大纲,本讲座中,将分别讲述两种鉴定蛋白质的方法。其一是质量纹鉴定法(Peptide Mass Fingerprinting),另外一种是二级质谱的数据库搜索鉴定法(MS/MS Database Searching)。我们将简略的介绍质量纹鉴定法。而用更多的时间讨论用于二级质谱上的方法。,多肽质量纹鉴定,多肽质量纹(Pept
2、ide Mass Fingerprinting,PMF)是从一级质谱(MS)中鉴定多肽的主要方法。多肽质量纹一般都是在MALDI-TOF仪器的结果上进行。其原理就是利用了蛋白序列数据库中的多肽质量的信息。我们下面的讨论,先假设一张质谱图对应一个蛋白。后面会讨论处理多个蛋白的情况。,一级质谱图,蛋白质经过酶解后,送入质谱仪,得到一级质谱。目前来说,由MALDI-TOF质谱仪产生的质谱图精度较高,而由ESI质谱仪产生的质谱图精度相对较低。另一个问题是,ESI产生的质谱图中的离子通常带有很多电荷,而MALDI质谱图中的离子一般只带一个电荷,比较容易计算。所以从一级质谱鉴定蛋白质的算法(质量纹)主要用
3、在MALDI-TOF产生的质谱图上。,Sample MS Spectrum,蛋白序列数据库,在美国国家生物信息中心的网站http:/ncbi.nlm.nih.gov上可以查询到最新的蛋白序列数据库。NCBI上的数据库中,信息最丰富的是Genpept格式,包括有蛋白的序列,各种性质,甚至于参考文献。但是对我们来说,我们只需要蛋白序列的信息就够了。,Genpept示例,Genpept示例,FASTA格式,FASTA格式就是蛋白的氨基酸序列。,虚拟酶解,对应于送进质谱仪的样品,我们可以对数据库里的序列作一次虚拟的酶解。,质量排列,虚拟酶解的结果,产生了一系列的多肽,我们可以计算每个多肽的质量。最后一
4、个R的质量多加了18,这是因为我们写在下面的是残基的分子量。,质量排列的,把所有多肽的质量排序。,质量纹,如此,质谱图上的质量就可以与多肽上的质量相匹配。,质量纹,这就是多肽质量纹(PMF)的最基础的思路。但是,真正的将之作为一个鉴定蛋白质的方法,还有很多需要考虑的问题。在讨论这些问题之前,我们先看一看目前常用的质量纹算法。,常用的质量纹算法,现在试验中可用的算法有:Mascot: http:/Profound: http:/prowl.rockefeller.edu/cgi-bin/ProfoundExpasy tools: http:/www.expasy.ch/tools/Peptide
5、Search: http:/mac-mann6.embl-heidelberg.de,PMF中的问题,第一个问题:质量相近的多肽怎么处理?在现实的蛋白数据库中,多肽的数量是很庞大的。这里面难保不会有质量非常相近的多肽。这样,就造成了质谱图上的一个峰可能匹配不止一个多肽,于是我们就难以知晓这张质谱图究竟代表哪个蛋白。,质量相近的多肽,Peak m/z: 1019.08,解决方案,第一个解决的办法是限制用来搜索的数据库。比如,你如果做的试验用的是小白鼠的组织,那么你可以只在鼠类的数据库中搜索,这样就可以减低出现这种情况的可能性。第二个解决的办法是要求必须有多个多肽和数据库相匹配,才做出最后的蛋白质
6、鉴定。,多匹配,DFPIANGER 1019.09,EPISVSSQQMLK 1347.56,VLDALDSIK 974.13,Carbonic anhydrase II,SHHWGYGKHBGPZHWHKDFPIANGERQSPVNIDTKAVVQDPALKPLALVYGEATSRRMVNNGHSFNVEYDDSQDKAVLKDGPLTGTYRLVQFHFHWGSSBBQGSEHTVDRKKYAAELHLVHWNTKYGDFGTAAQQPDGLAVVGVFLKVGDANPALQKVLDALDSIKTKGKSTDFPNFDPGSLLPNVLDYWTYPGSLTTPPLLESVTWIVLKEPI
7、SVSSQQMLKFRTLNFNAEGEPELLMLANWRPAQPLKNRQVRGFPK,多匹配可以大大降低随机匹配的概率,从而增加结果的可信度,长蛋白和短蛋白,第二个问题:长蛋白可能会更容易的被匹配。因为长蛋白里的多肽数目较多,即以概率来算,匹配上的几率也会比较大。质量纹算法必须考虑这个问题,给短蛋白一定的补偿。,多个蛋白的情况,第三个问题就是在一张质谱图中可能有多个蛋白存在。通常,MALDI-TOF是与双向电泳连接使用。双向电泳的一个电泳点上可能有2-3个蛋白,这样就增加了鉴定的难度。由于无法预知一个电泳点上有多少蛋白质,PMF的效果可能会受到很大的影响。,多肽质量纹:小结,质量纹算法是
8、用一级质谱鉴定蛋白质的经典方法。质量纹算法比较简单,一般使用较简单的统计模型,速度一般较快。质量纹算法的效果受到很多方面的限制,首先是仪器精度的限制,其次是样品中可能有多个蛋白的限制。这使得质量纹算法不是理想的分析复杂混合物中蛋白成分的方法。返回,利用二级质谱图,我们刚才谈到了,多肽质量纹有其先天的不足。其中,最糟糕的是它不能处理多个蛋白的混合物。如果我们能够处理混合物,就可以减少很多用于纯化上的时间和精力。那么,怎么才能从混合物中鉴定蛋白呢?这就要用到二级质谱。,二级质谱图,在一级质谱图中,选择其中的一个峰,对其进行CID过程,就得到一张二级质谱图。这里的假设是一级质谱中的一个峰就对应了一个
9、多肽,实际情况可能并不是这样。对于一张一级质谱图,可以选择多个峰进行二级质谱的操作。这样就可以适应一张质谱图里有多个蛋白的情况。,典型二级质谱图,CID,CID,即Collision-induced Dissociation,是通过撞击使得多肽的肽键断裂的过程。在做二级质谱的试验时,质谱仪选择一级质谱中的一个峰,也就是对应质荷比的这些离子,让这些离子高速撞击质谱仪中的惰性气体,使其肽键断裂,这就是CID。,肽键及其断裂,一些常见的特殊情况,除了普通的肽键断裂以外,还经常有一些特殊的情况。Neutral loss: 某些酸性氨基酸可能会在CID中丢失一个水分子(H2O),而碱性氨基酸会在CID中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 鉴定 多肽 蛋白质 ppt 课件

链接地址:https://www.31ppt.com/p-1389456.html