蛋 白 质组学课件.ppt
蛋 白 质 组 学,主讲:无忌,回顾:中心法则及其补充,翻译后得到的蛋白质就可以行使其功能吗?,新合成的 蛋白质,翻译后的修饰,(糖基化、磷酸化等),亚细胞定位或迁移,分子间的相互作用等,都会造成蛋白质分子的构象和功能发生变化,一个已知的基因序列也很难预测其编码的蛋白质的功能。 同时,蛋白质翻译的修饰、结构形式、蛋白质分子的相互作用及蛋白质分子与其他分子的相互作用等问题,都是基因组学所不能回答的。因此,科学家们就把研究的重心由基因转向了其编码合成的全部蛋白质。,一.蛋白质组学产生背景,20世纪中后期,生命科学研究进入了分子生物学时代。2. 随着人类基因组全序列测定,生命科学跨入了后基因组时代。3. 因mRNA的表达情况不能直接反应蛋白质的表达水平。,4. 蛋白质有自身特有的活动规律,如动态修饰、加工、转运定位、结构形成、代谢等,均无法从基因组水平上的研究获知。蛋白质构象病更难于只靠DNA序列来解释。5. 蛋白质不能动态反映生物系统所处的状态。,二.蛋白质组与蛋白质组学的概念1.蛋白质组(Proteome) :1994年由澳大利亚Macquarie大学的学生Wilkins和他的老师提出,最早见文献是1995年7月的“Electrophoresis”杂志上。指基因组表达的所有相应的蛋白质,也可说是指细胞或机体全部蛋白质的存在及其活动方式。2.蛋白质组学:研究细胞内全部蛋白质的组成及其活动规律的科学。,The era of omics-based scienceGenomics (基因组学)Post-genomic science (后基因组时代)Functional genomics (功能基因组学)Transcriptomics( 转录组学)Proteomics (蛋白质组学)Metabolomics (代谢组学)Structural genomics (结构基因组学)Aim - 3D structures of all protein folds !,蛋白质组具有多样性和可变性的特点(1)蛋白质的种类和数量在同一机体的不同细胞中是各不相同的。(2)同一细胞,在不同时期、不同条件下,蛋白质组也是在不断改变的。(3)在病理或治疗过程中,细胞蛋白质的组成及其变化与正常生理过程的也不同。,蛋白质组学不是一个封闭的、概念化的、稳定的知识体系,而是一个领域。 它旨在阐明生物体全部蛋白质的表达模式及功能模式,其内容包括蛋白质的定性鉴定、定量检测、细胞内定位、相互作用研究等,最终揭示蛋白质功能,是基因组DNA序列与基因功能之间的桥梁, 是在蛋白质水平上定量、动态、整体性地研究生物体。,三.蛋白质组研究的意义,蛋白质组的研究能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。,基因组与蛋白质组比较,基因组 转录组 蛋白组,The study of proteins expressed by genomesCompletion of the sequencing of the 1st draft of human genome indicates there are approximately 250,000 proteins in the human genomeOnly 2-5% of proteins in human genome have been identified,表达蛋白质组学,研究细胞所表达的蛋白质种类,结构蛋白质组学,研究细胞内蛋白质的结构,功能蛋白质组学,研究细胞内蛋白质的功能,是指从动态和整体的角度研究蛋白质的功能及其结构基础,是位于对个别蛋白质的传统研究和以全部蛋白质为研究对象的蛋白质组研究之间的层次。,四.蛋白质组学的(具体)研究内容,细胞或组织内蛋白质的表达模式及修饰(表达蛋白质组学): 关键技术:2-D电泳2. 蛋白质的序列和高级结构(结构蛋白质组学):X-射线单晶衍射分析(晶体结构分析)、多维核磁共振波谱分析、电镜二维晶体三维重构术(电子晶体学)。,3. 蛋白质的胞内分布及移位(细胞图谱蛋白质组学):确定蛋白质在亚细胞结构中的位置,通过纯化细胞器或用质谱仪鉴定蛋白复合物组成等。4. 蛋白质的功能模式(功能蛋白质组学):蛋白质与蛋白质及其与其他分子的相互作用,表达系统的蛋白质组研究,大肠杆菌的蛋白质组研究酿酒酵母的蛋白质组研究,大肠杆菌的蛋白质组研究,大肠杆菌全部4000多个基因的DNA序列已被测定, 建立蛋白质 基因联合数据库,并希望籍此来回答以下几方面的问题:a. 所有编码基因的产物在双向图谱上的位置 各种蛋白质的丰度 不同条件下各种蛋白质表达水平及合成速率的变化 各种蛋白质在细胞内的定位 某些蛋白质翻译后修饰的方式及水平,目前,大肠杆菌的联合数据库已更新到第六版,大约包括1600个蛋白质斑点的数据,其中大约400个蛋白质斑点已与大约350个基因相对应(有些基因可能有多个蛋白质产物),对于这些蛋白质,这个数据库可以提供基因名称、蛋白质名称、EC 编号、功能范畴、Swiss-prot数据库编号、Genbank序列号、基因图谱的位置、染色体上的转录方向以及一些生理信息(如在不同生长条件下该蛋白质在细胞内的丰度).,酿酒酵母的蛋白质组研究,利用双向电泳技术分析酵母蛋白谱的工作早于蛋白质组概念的提出.酿酒酵母(Saccharomyces cerevisiae)基因组的完成及其蛋白质数据库在互联网上的建立,大大加速了这一工作.最新版的数据库包括6000多页,每页代表一个已知或推测的酵母蛋白.,它包含以下几方面的信息: 以序列为基础的已知和推测的酵母蛋白的特征信息,如分子质量、等电点、氨基酸组成、多肽片段大小等 一些研究得到的关于各种蛋白质在翻译后加工、亚细胞定位、功能分类方面的信息 从以往的超过5000篇关于酵母蛋白研究的文章中获得的有关各种蛋白质功能、相互作用、突变表型的信息.借助数据库的有力推动,在双向电泳蛋白质谱上最明显的蛋白质斑点的大部分得到鉴定,正在丹麦进行的一项研究计划分别作出野生型和将基因系统缺失的缺陷型酵母的双向蛋白质图谱。 初步的研究表明,缺失单一基因将导致的结果并不只是缺乏此基因编码的蛋白质,而是能导致其他一系列蛋白质量的改变。一些蛋白质减少而另一些蛋白质增多,当然还有一些蛋白质被加工修饰而导致性状改变。 单一基因缺失的结果总是引起蛋白质组全局性的变化。大约20%的酵母基因缺失是致死性的,另外80%则不然,这时机体能通过调节蛋白质的表达来对抗这种内源性的变化。 这种基因缺失的研究可能会告诉我们一些关于细胞内蛋白质分子间相互“对话”和“作用”的重要信息,如蛋白质间的物理联系(这些蛋白质可能会组成蛋白质复合物),信号传递途径,以帮助我们了解细胞是如何构成的以及是如何协同工作的。,人类的蛋白质组研究,对人蛋白质组的研究主要聚焦在特异的组织、细胞和疾病上. 证据表明,尽管人的不同组织有着很大的功能差别,但其中的许多蛋白质是看家蛋白,因此它们的双向图谱可能也是近似的.这点与简单生物不同,简单生物在不同的发育阶段有着极不相同的蛋白质组.因此对于人类来说,一个高质量的基本的双向图谱是非常有用的,它可以作为其他组织、细胞的参照图谱.人的各种组织、器官、细胞乃至各种细胞器已被广泛研究.,人的各种体液被用于研究与某些疾病的关系.最近澳大利亚科学家利用双向电泳技术研究眼泪中的蛋白质与生理状态的关系.他们发现了一种新的蛋白质,这个蛋白质非常相似于在乳腺癌细胞里高表达的另一种蛋白质.这个发现可能会提供疾病诊治的新的手段.在一项利用蛋白质组研究技术进行的酒精对人体毒性的研究中发现,乙醇会改变血清蛋白糖基化作用,导致许多糖蛋白的糖基缺乏,如转铁蛋白。,五.蛋白质组学技术,蛋白质组学技术的发展已经成为现代生物技术快速发展的重要支撑,并将引领生物技术取得关键性的突破。蛋白组学技术主要包括双向凝胶电泳、等电聚焦、生物质谱分析及非凝胶技术。,1.双向凝胶电泳 双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。由于双向电泳技术在蛋白质组与医学研究中所处的重要位置,它可用于蛋白质转录及转录后修饰研究,蛋白质组的比较和蛋白质间的相互作用,细胞分化凋亡研究,致病机制及耐药机制的研究,疗效监测,新药开发,癌症研究,蛋白纯度检查,小量蛋白纯化,新替代疫苗的研制等许多方面。近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。,2.等电聚焦 等电聚焦(isoelectric focusing,IEF)是60年代中期问世的一种利用有pH梯度的介质分离等电点不同的蛋白质的电泳技术。等电聚焦凝胶电泳依据蛋白质分子的静电荷或等电点进行分离,等电聚焦中,蛋白质分子在含有载体两性电解质形成的一个连续而稳定的线性pH梯度中电泳。载体两性电解质是脂肪族多氨基多羧酸,在电场中形成正极为酸性,负极为碱性的连续的pH梯度。蛋白质分子在偏离其等电点的pH条件下带有电荷,因此可以在电场中移动;当蛋白质迁移至其等电点位置时,其静电荷数为零,在电场中不再移动,据此将蛋白质分离。,3.生物质谱 生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和离子阱质谱(ESI- MS)。,3.1基质辅助激光解吸电离-飞行时间质谱 MALDI 的电离方式是 Karas和Hillenkamp于1988年提出。MALDI的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS一般用于肽质量指纹图谱,非常快速(每次分析只需35min),灵敏(达到fmol水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS不能给出肽片段的序列。,3.2离子阱质谱(ESI-MS) ESI- MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是 分析时间一般较长。 目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。,4.蛋白质组研究的新技术 双向凝胶电泳存在繁琐、不稳定和低灵敏度等缺点。发展可替代或补充双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的目标。目前,二维色谱 (2D-LC)、二维毛细管电泳 (2D-CE)、液相色谱毛细管电泳 (LC-CE) 等新型分离技术都有补充和取代双向凝胶电泳之势。另一种策略则是以质谱技术为核心,开发质谱鸟枪法(Shot-gun)、毛细管电泳-质谱联用 (CE-MS)等新策略直接鉴定全蛋白质组混合酶解产物。随着对大规模蛋白质相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也被科学家所关注。此外,蛋白质芯片的发展也十分迅速,并已经在临床诊断中得到应用。,六.发展进展,各国政府支持,国际著名研究和商业机构加盟:1996年澳大利亚建立了世界上第一个蛋白质组研究中心(Australia Proteome Analysis Facility,APAF),美国国立癌症研究院(NCI)投资1 000万美元建立肺、直肠、乳腺、卵巢肿瘤的蛋白质组数据库。NCI和FDA共同投资数百万美元建立癌症不同阶段的蛋白质组数据库。英国建立三个蛋白质组研究中心对已完成或即将完成全基因组测序的生物体进行蛋白质组研究。,Celera公司投资上亿美元独自启动了全面鉴定和分类汇总人类组织、细胞和体液中的蛋白质及其异构体,构建新一代的蛋白质表达数据库的工作。,1997年召开了第一次国际“蛋白质组学”会议 1998年在美国旧金山召开了第二届国际蛋白质组学会议 1999年1月在英国伦敦举行了应用蛋白质组会议,我国也于1998年启动了蛋白质组学研究,在中科院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会,2003成立了中国人类蛋白质组组织(CHHUPO),并分别于2003年9月、2004年8月以及2005年8月召开了中国蛋白质组学首届、第二届及第三届学术大会,2004年10月在中国北京召开了第三届国际蛋白质组学会议。,科技部已将疾病蛋白质组研究列入我国“973”计划项目和“863”计划项目;国家自然科学基金委员会也将“蛋白质组研究”列为重点项目。我国在鼻咽癌、白血病、肝癌和肺癌蛋白质组研究方面取得了较大的进展。,七.发展趋势,1.在基础研究方面 近两年来蛋白质组研究技术已被应用到各种生命科学领域,如细胞生物学、神经生物学等。在研究对象上,覆盖了原核微生物、真核微生物、植物和动物等范围,涉及到各种重要的生物学现象,如信号转导、细胞分化、蛋白质折叠等等。在未来的发展中,蛋白质组学的研究领域将更加广泛。,2.在应用研究方面 蛋白质组学将成为寻找疾病分子标记和药物靶标最有效的方法之一。在对癌症、早老性痴呆等人类重大疾病的临床诊断和治疗方面蛋白质组技术也有十分诱人的前景,目前国际上许多大型药物公司正投入大量的人力和物力进行蛋白质组学方面的应用性研究。,3.在技术发展方面 蛋白质组学的研究方法将出现多种技术并存,各有优势和局限的特点,而难以象基因组研究一样形成比较一致的方法。除了发展新方法外,更强调各种方法间的整合和互补,以适应不同蛋白质的不同特征。另外,蛋白质组学与其它学科的交叉也将日益显著和重要,这种交叉是新技术新方法的活水之源,特别是,蛋白质组学与其它大规模科学如基因组学,生物信息学等领域的交叉,构成组学(omics)生物技术研究方法,所呈现出的系统生物学(System Biology)研究模式,将成为未来生命科学最令人激动的新前沿。,八、蛋白质数据库,1.蛋白质序列数据库 SWISS-PROT数据库: http:/www.ebi.ac.uk/swissprot PIR和PSD数据库 http:/pir.georgetown.edu/ ftp:/nbrfa.georgetown.edu/pir,蛋白质数据仓库 http:/www.rcsb.org/pdb/ 蛋白质结构分类数据库 http:/scop.mrc-lmb.cam.ac.uk/scop/ PROSITE数据库 http:/www.expasy.ch/proside/,蛋白质结构数据库,2、蛋白质数据库,蛋白质直系同源簇(COGs)数据库 http:/www.ncbi.nlm.nih.gov/COG DIP数据库(DIP Database) http:/dip.doe-mbi.ucla.edu/,3.、蛋白质数据库,4、蛋白质数据库的应用,(一)序列比较 序列两两对比 多序列对比(二)临床诊断(三)肿瘤治疗药物的开发,