蛋白质组与临床蛋白质组学.ppt
蛋白质组学Proteomics,硕士生学位课程:,总学时数:36教学目的和要求1.掌握蛋白质组与蛋白质组学的基本概念,基本理论与基本方法。2.熟悉蛋白质组研究的关键技术。3.熟悉利用蛋白质组研究策略设计研究课题的基本思路。4.培养开展临床蛋白质组学与疾病蛋白质组学研究的基础能力。,按照课程的总体要求,将课程分为12个专题进行讲授:,1、蛋白质组与蛋白质组学 2、蛋白质组学研究中的样品制备与分离技术3、生物质谱 4、蛋白质研究的其它方法(1)5、蛋白质研究的其它方法(2)6、临床蛋白质组学与疾病蛋白组学7、药物蛋白质组学及其临床应用,8、血浆/血清蛋白质组学和体液蛋白质组学9、亚细胞蛋白质组学及研究进展10、心血管系统与消化系统疾病蛋白质组学11、神经系统蛋白质组学12、临床肿瘤蛋白质组学,授课教师,第1讲:邱宗荫 教授第2讲:颜玉蓉 副教授第3讲:母昭德 副教授第4讲:周 兰 教授第5讲:张雪梅 教授第6讲:冯 涛 教授,第7讲:张雪梅 教授第8讲:何於娟 副教授第9讲:颜玉蓉 副教授第10讲:冯 涛教授第11讲:周 兰教授第12讲:周 兰教授,参考教材与文献,主要参考教材:邱宗荫,尹一兵 等 编著,临床蛋白质组学。科学出版社,2008.4。其它参考教材:1、R.J.Simpson.Proteins and Proteomics:A Laboratory Manual.(影印版)。科学出版社,2003。,2、R.J.Simpson.Purifying Proteins for Proteomics.(影印版)。科学出版社,2004。3、夏其昌 曾 嵘 等编著。蛋白质化学与蛋白质组学。科学出版社,2004。4、陈主初 肖志强 主编。疾病蛋白质组学。化学工业出版社,2006。,主要参考杂志,1、Proteomics(WILEY-VCH Verlag GmbH&Co.KGaA,Weinheim)2、Proteomics-Clinical Applications(WILEY-VCH Verlag GmbH&Co.KGaA,Weinheim)3、Electrophoresis(WILEY-VCH Verlag GmbH&Co.KGaA,Weinheim)4、Molecular&Cellular Proteomics(MCP)American Society for Biochemistry and Molecular Biology(ASBMB)5、Journal of Proteome Research(American Chemical Society),相关杂志,Proceedings of the National Academy of Science of the United State of America(美国国家科学院院刊),简称PNAS.Journal of the National Cancer Institute(Journal of NCI)Oxford University Press(OUP)and National Cancer Institute(美国国家癌症研究所,NCI)Journal of Biological Chemistry(JBC)(American Society of Biochemistry and Molecular Biology,Inc.),授人以鱼,不如授人以渔。授人以鱼,三餐之需;授人以渔,终生之用。,我们应该从这门课程中学习当今生命科学前沿领域的研究思想,观点和方法。,第1讲:蛋白质组与蛋白质组学Proteome and Proteomics,重庆医科大学药学院邱宗荫,本次讲授的内容,、从基因组到蛋白质组、蛋白质组与蛋白质组学的内涵、关于蛋白质、蛋白质组与基因组的差别、蛋白质组学的研究策略,、从基因组到蛋白质组,对人类文明产生重大影响的科学技术工程,曼哈顿计划阿波罗计划人类基因组计划,2023/10/4,13,人类基因组计划在科学上的目的,是测定组成人类基因组的30亿个核苷酸的序列。从而奠定阐明人类所有基因的结构与功能,解读人类的遗传信息。,The Human Genome,The International Human Genome ConsortiumInitial sequencing and analysis of the human genomeNature,409,February 15,860-921(2001),Venter et al.(Celera)The Sequence of the Human GenomeScience,291,February 16,1304-1351(2001),Genes predicted in Human Genome,Intl Consortium Celeraknown genes 14,882 17,764novel genes 16,896 21,350Total 31,778 39,114,人类基因数缩水再缩水,由于测序技术方法的不断发展,对基因组分析的误差也在逐渐缩小。人类基因组数量也从34万,缩水到了25000左右。2007年,根据Broad研究所一项发表在PNAS上的研究表明,人类基因目录如Ensembl、RefSeq和Vega包括了许多开放阅读框,它们是任意出现的而不是蛋白质编码区域。这些发现将人类基因组中的蛋白质编码基因数目减少到了20500个。随着研究的进一步深入,这个数目还可能会有变化。而人类基因组中蛋白质编码基因数量之少,也是令人惊讶的。,人们认识生命过程分子机制的60年历程,1944 Avery et.al.provide evidence that DNA is the hereditary material1953 Watson&Crick publish the double helical structure of DNA 1963 Nirenberg elucidates the genetic code,1964 Perutz connects the 3-D structure of proteins to the amino acid sequence1972-74 Development of recombinant DNA technology1975-85 Development of techniques for rapid DNA sequencing,post-genome era,1990 Initiation of the Human Genome Project1995 First complete genome published(流感嗜血杆菌基因组序列首次被破译,在此后不到两年的时间,近50个细菌的基因组序列已被完成)1996 Affymetrix publishes about GeneChip2001 Human Genome Project completed,In The News:,“If 2000 was the year of the Genome,2001 will be the year of the Proteome”Nightly Business Report 12/27/00,Time Magazine 7/3/00,The Economist 12/9/00,chemistry&engineering news 7/31/00,Scientific American 7/00,1994年,澳大利亚科学家Marc Wilkins提出蛋白质组概念。,The term was coined by Marc Wilkins in 1994 in the symposium:2D Electrophoresis:from protein maps to genomes in Siena,Italy,and was subsequently published in 1995,which was part of his PhD thesis.Wilkins used it to describe the entire complement of proteins expressed by a genome,cell,tissue or organism.Wasinger VC,Cordwell SJ,Cerpa-Poljak A,Yan JX,Gooley AA,Wilkins MR,Duncan MW,Harris R,Williams KL,Humphery-Smith I.(1995).Progress with gene-product mapping of the Mollicutes:Mycoplasma genitalium.Electrophoresis 7(7):109094.,2001年2月15日,英国自然周刊在发布人类基因组框架图时,同期登载了一条关于人类蛋白质组研究组织(Human Proteome Organization,HUPO)成立的消息,标题就叫“现在是蛋白质组了”。人类蛋白质组组织(HUPO)是一个国际事务、学术和政府成员的联盟。HUPO成立后,欧洲、亚太地区相继成立了区域性蛋白质组研究组织。,Nature,March 13,2003,HUPO的工作重点为人类疾病与健康,协调公共蛋白质组组织的活动,鼓励有关人类蛋白质组和生物模型蛋白质组知识的广泛传播,将各国和各地区的蛋白质组研究组织统一在一个国际性的组织之中,DNA Complete description of genes in an organism,RNA Complete description of mRNA in a genome,ProteinComplete description of proteinsexpressed by a genome,Metabolites Complete description of metabolites expressed by a genome,Catalog of all protein-DNA,protein-RNA,and protein-protein interactions,Genome Genomics,Transcriptome Transcriptomics,Proteome Proteomics,Metabolome Metabolomics,Interactome System Biology,Global,Targeted,Global,Targeted,Global,Targeted,Functional genomics or“phenomics”,、蛋白质组与蛋白质组学的内涵,蛋白质组,蛋白质组的英文是PROTEOME,它来源于PROTEins和genOME两个词的组合,意思是Proteins expressed by a genome,即由基因组表达的蛋白质。随后,学者们对蛋白质组学的含义作了进一步的阐述,认为“proteome”代表一个完整生物或生物体不同细胞组合中的全部蛋白质。因此,目前认为蛋白质组的内涵是一个细胞、一类组织或一种生物的基因组所表达的全部蛋白质。,蛋白质组学,蛋白质组学(Proteomics)旨在阐明生物体全部蛋白质的表达模式及功能模式,其内容包括鉴定蛋白质的存在方式(修饰形式),研究其结构、功能、定量和相互作用等。,Proteomics,Proteomics can be defined as the qualitative and quantitative comparison of proteomes under different conditions to further unravel biological processes.“Proteomics includes not only the identification and quantification of proteins,but also the determination of their localization,modifications,interactions,activities,and,ultimately,their function.”(Stanley Fields.Proteomics in Genomeland.Science 16 February 2001 291:1221-1224),从认识生命的科学理论体系看,蛋白质组学属于系统生物学的范畴。,在过去的半个多世纪里,生物学和医学的研究主要是基于分析方法或还原方法(reduction approach)来探求生命现象的本质。其基本的研究思路是建立在将生物系统分解,或还原成各个组成部分的基础上。人们按照这种还原主义的研究策略已经获得了大量和重要的关于生物学“部件”的认识,特别是对于单个基因和蛋白质的结构和功能有了越来越深入的了解。但是,还原主义研究策略的固有缺陷是难以从整体上了解生命系统的协同行为,更谈不上去了解生命系统协同行为的变化如何导致人类疾病的发生、发展,以及生命现象纷繁复杂的变化。,系统生物学(System/Systems Biology),系统生物学将生命过程作为一种大系统,而不是作为孤立的很多部分来进行定性和定量研究。它借助和发展多学科交叉的新的技术策略和方法,研究生命系统中所有组成成分的系统行为、相互联系以及动力学特性,进而揭示生命系统的基本规律与调控手段。以生物系统内的所有组成部分及其相互关系为对象,通过大规模动力学分析,用数学方法抽象出生物系统的设计原理和运行规律。,将当前生物科学知识全面系统地联系在一起组建超级数据库网络-对盲人摸象认识论的革命,盲人摸象这个谚语是对“只见树木、不见森林”认识论的讽刺。遗憾的是,我们都曾经受到过这种认识论的影响。随着对大象表观基因组、基因组、转录组,蛋白质组以及糖组越来越精确的分析,人们越来越多地了解到事物的整体属性及其本质。但即便如此,我们仍需要知道各部分是怎样协调运作从而组成一个完整的大象的。,整体由部分构成图片来源:Wildlife Stock Pictures,Mining proteomes,To identify as many components of the proteome as possible,Mapping of proteomes of various organisms and tissuesComparison of protein expression levels for the detection of disease biomarkers,Department of Genomics&Proteomics,Department of Genetics&Biochemistry,Stanley Fields.Proteomics in Genomeland.Science 16 February 2001 291:1221-1224,、关于蛋白质,Proteins are polyamides,their monomeric units are comprised of 20 different-amino acids,Proteins,main building blocks and functional molecules of the cell20%of cell weight(water:70%)four levels of structure3 10 nm,Function of Proteins,Enzymatic proteins(catalysts for such functions as digestion)Structural proteins e.g.collagen and elastin(connective tissue)Contractile proteins e.g.myosin(muscle movement)Transport proteins e.g.hemoglobin molecules(oxygen transport),Storage proteins e.g.casein(major source of aa for baby mammals)Hormonal proteins e.g.insulin(regulates sugar conc.in the blood)Receptor proteins(build into the membrane of nerve cells)Defensive proteins(antibodies to protect against diseases),R is commonly one of 20 different side chainsAt pH 7 both the amino and carboxyl groups are ionized,aminogroup,alphacarbon,carboxylgroup,side chaingroup,Amino Acid氨基酸是组成肽和蛋白质的基本单位,Families of Amino Acids,The common amino acids are grouped according to whether their side chains are:acidic D,Ebasic K,R,Huncharged polar N,Q,S,T,Ynonpolar G,A,V,L,I,P,F,M,W,CHydrophilic amino acids(uncharged polar)are usually on the outside of a protein whereas nonpolar residues cluster on the inside of proteinBasic or acidic amino acids are very polar and are generally found on the outside of protein molecules,Peptide Bonds,Amino acids are joined together by an amide linkage called a peptide bond.The two bonds on either side of the rigid planar peptide unit exhibit a high degree rotation,peptidebonds,rotation occurs here,Proteins are molecules that contain one or more polypeptide chains,Polymers containing:2 amino acid residues are called dipeptides3-/-tripeptides3-10-/-oligopeptidesMany-/-polypeptides,蛋白质的分子结构有四个层次,1,2,3,4,序列构型活性调节,Mathews et al(2000)Biochemistry(3e)p.195,Alpha-helix,Beta-sheet,Primary structure,Secondary structure,Tertiary structure,Quaternary structure,3D Structure of Protein,Alpha-helix,Beta-sheet,Loop and Turn,Turn or coil,Heme Groups in Hemoglobin,PositivelyChargedcanyon,蛋白质的物理化学特性(一),1.蛋白质的大小与形状 蛋白质分子量变化范围很广,从几千到几十万,大多数蛋白质的平均分子量约为4万5万,更大的蛋白质通常由多个亚基组成。2.蛋白质的构象 不需要共价键的变化,就能使立体结构改变的立体结构现象称为构象(conformation)。蛋白质的构象取决于其一二三四级结构。某些蛋白质的构象还受结合辅基的影响。,蛋白质的物理化学特性(二),3.蛋白质的电荷通常每个蛋白质含有一个氨基末端和一个羧基末端,往往还有带电荷的氨基酸侧链。因此,蛋白质在溶液中呈现酸-碱效应。当pH为某一数值时,蛋白质所带正电荷和负电荷数相等,分子净电荷为零,此pH即为蛋白质的等电点(pI)。当pHpI时,蛋白质分子带负电荷;当pHpI时,蛋白质分子带正电荷。大多数蛋白质的等电点介于pH 4.57.0,在pH约为7.4的生理条件下带负电荷,,蛋白质的物理化学特性(三),4.蛋白质的疏水性 一般情况下,天然蛋白质构象中,由于疏溶剂作用,疏水基团位于分子内部。非极性侧链在疏水区域以疏水键结合,这是稳定蛋白质的重要因素。5.蛋白质的溶解性 蛋白质分子中,氨基酸残基上的可电离基团处于蛋白质的表面。对于球状蛋白质,这些表面电荷保证它们具有特定的水溶性以及在水性生理环境中实现其特殊功能所必须的结构灵活性。,Juang RH(2004)Proteomics,蛋白质的氨基酸排列是由其基因的单核苷酸序列所决定,Genome,Transcriptome,Proteome,DNA,RNA,Protein,复制Replication,转录Transcription,翻译Translation,逆转录ReverseTranscription,Genotypes to Phenotypes,核糖体,蛋白质的生物合成,Gene:continuous stretch of DNA,from which a particular type of proteins can be made转录(transcription)是以DNA中的一条单链为模板,以四种三磷酸核苷(NTP)为原料,在DNA依赖的RNA聚合酶催化下合成RNA链的过程。,1.Transcription,2.Splicing,pre-mRNA,内含子,外显子,RNA剪接(RNA splicing):将转录形成的mRNA前体(pre-mRNA)中的内含子剪除,将外显子连接起来形成一个连续的RNA分子的加工过程。,生物的基因序列中,包含了内含子(intron)与外显子(exon),两者交互穿插,组成基因。其中内含子并不表现,外显子才是能够转录成mRNA的片段。,3.Translation,将mRNA上的核苷酸序列转变为蛋白质上的氨基酸序列的过程。,The Biosynthesis of protein,蛋白质的生物合成:将核酸中由4 种核苷酸序列编码的遗传信息,通过遗传密码破译的方式解读为蛋白质一级结构中20种氨基酸的排列顺序。,核蛋白体ribosome,mRNA,多肽polypeptide,The Next Revolution in Bioscience is PROTEOMICS,GENOMICS,PROTEOMICS,DNA,RNA,Protein,Active CellularProtein,Enzymes,Environment,Ribosomes,Understanding the structure and function of proteins encoded by a particular genome,tissue,or organelle.,、蛋白质组与基因组的差别,Genomics vs.Proteomics,“A butterfly and a caterpillar have the same genome but different proteomes.”-Ron Orlando,一种生物有一个基因组,但有许多蛋白质组,任何蛋白质,即使只是同一个基因的产物,也可能存在多种形式。在一个特定的细胞内或在不同的细胞之间,蛋白质的存在形式可能不同,大多数蛋白质都以几种不同的修饰形式存在。这些修饰影响着蛋白质的结构、定位、功能和转换。,在不了解基因组序列的情况下,人们曾经推测,生命的复杂程度是由基因组的基因数量来决定的。也就是说,生命的复杂程度越高,其基因组拥有的基因数目越大。但随着各种生物的基因组全序列的测定,科学家们认识到情况并非如此。线虫基因组 基因数为1.9万多个。人基因组 基因总数仅仅比线虫多1.5万个左右,远不是预期的10万到15万。水稻基因组 基因总数为4.6万到5.5万之间,比人的基因还要多。,103 104 105 106 107 108 109 1010 1011 1012,原核生物Procaryotes,真核生物Eucaryotes,病毒,细菌,E.Coli,真菌,酵母,植物,豆科植物,果蝇,昆虫,软体动物,鲨鱼,软骨鱼,多骨鱼,两栖动物,蟾蜍,爬虫类,鸟类,哺乳动物,人类,基因数,蛋白质组与基因组的重要差别之一:蛋白质组具有多样性,蛋白质组中蛋白质的数目超过基因组的数目,呈现出丰富多彩的表型。这一事实被许多研究证实与以下两种因素有关:1、在转录时,一个基因可以剪接为多种mRNA形式,即可变剪接(Alternate splicing)。2、同一蛋白可能以许多形式进行翻译后的修饰(Post-translational Modifications,PTM)。,A few numbers to realize the complexity of the task,Cell proteome:5103 proteinsProteome from an individual:1106 proteinsProteome of an individual(all life):1107 proteinsProteome of a species:1108 proteins,RNA的可变剪接(选择性剪接)(Alternate splicing),可变剪接是指同一基因转录形成的RNA前体可经过一种以上剪接方式产生多种不同的mRNA的过程。可变剪接将同一基因中的外显子以不同的组合方式来表现,使一个基因在不同时间、不同环境中能够制造出不同的蛋白质。可变剪接作用使蛋白质组的复杂性远远高于基因组。,Alternate splicing,Alternate splicing can be regulated differential splicing can occur at different times during development and in different cell types,1,2,3,4,GENE(hnRNA),1,1,2,3,3,4,4,2 Different mRNA products,蛋白质组与基因组的重要差别之一:蛋白质的多样性,stopcodon I,stopcodon II,startcodon,DNA,pre-mRNA,stopcodon I,stopcodon II,startcodon,stopcodon II,startcodon,stopcodon I,stopcodon II,startcodon,AAAAA,AAAAA,intron,exon,mRNA II,COOH,COOH,H2N,H2N,Hydrophobic peptide,Hydrophylic peptide,plasma-membrane,RNAsplicing,IgG heavy chainencoding gene,mRNA I,I,II,translation,transcription,nucleus,Alternative splicing:how one gene gives rise to different proteins,B lymphocyte,lightchain,heavychain,蛋白质翻译后修饰(Post-translational Modifications,PTM),蛋白质翻译后修饰在生命体中具有十分重要的作用,它使蛋白质的结构更为复杂,功能更为完善,调节更为精细,作用更为专一。细胞内的大部分蛋白质通常都被进行过翻译后修饰。迄今为止,已发现的蛋白质翻译后修饰方式已超过200种,主要是磷酸化、糖基化、酰基化、硝基化、磺基化、脂化、泛素化和水解修饰等。蛋白质的翻译后修饰使数量有限的编码基因产生数量巨大的蛋白质。,Post-translational Modifications,PTM,PTMs are found on all types of protein,from nuclear transcription factors to metabolic enzymes,structural proteins and plasma-membrane receptors.PTMs affect the physicochemical properties of proteins,which provides a mechanism for the dynamic regulation of molecular self-assembly and catalytic processes through the reversible molecular recognition of proteins,nucleic acids,metabolites,carbohydrates and phospholipids.,General Characteristics,Are 200 known typesPresent on at least 80%of eukaryotic proteinsFound in all speciesLocated at specific sequence motifs(sequons)Often transientUsually present at substoichiometric levelsOften act together,This schematic figure shows the location and role of a selection of some of the most important of more than 200 types of post-translational modification(PTM).,Phosphorylation cascades are involved in many signalling pathways,Plasma membraneproteins can carryN-glycans,The histone codecontrols many nuclear processes,Nuclear and cytoplasmicproteins can carry O-glycans,Various modification regulate microtubule function,Plasma-membrane proteinscan be linked to the membrane by a GPI anchor,Polyubiquitylationcan induce proteindegradation,Ac,acetyl group;GPI,glycosylphosphatidylinositol;Me,methyl group;P,phosphoryl group;Ub,ubiquitin.,蛋白质的糖基化是低聚糖以糖苷的形式与蛋白上特定的氨基酸残基共价结合的过程。,Glycosylation:Carbohydrates added to basic protein structure,Folded protein structure(schematic),葡萄糖(Glc),甘露糖(Man),半乳糖(Gal),N-乙酰葡糖胺(GlcNAC),唾液酸,泛指的(Sia),泛素与泛素化,以色列科学家阿龙切哈诺沃(Aaron Ciechanover,1947-)、阿夫拉姆赫什科(Avram Hershko,1937-)和美国科学家欧文罗斯(Irwin Rose,1926-)因在“泛素调节的蛋白质降解”方面的出色研究而获得2004年诺贝尔化学奖。这三位科学家发现,一种被称为泛素的多肽在需要能量的蛋白质降解过程中扮演着重要角色。这种多肽由76个氨基酸组成,它最初是从小牛的胰脏中分离出来的。它就像标签一样,被贴上标签的蛋白质就会被运送到细胞内的“垃圾处理厂”,在那里被降解。,泛素与泛素化,泛素:泛素(Ubiquitin)是由76个氨基酸组成的高度保守的多肽链,因其广泛分布于各类细胞而得名。泛素化:泛素共价地结合于底物蛋白质的赖氨酸残基,被泛素标记的蛋白质将被特异性地识别并迅速降解,泛素的这种标记作用是非底物特异性的。泛素化是细胞维持对那些受组成型调节和环境刺激产生的蛋白质水平的基本调节方式。泛素-蛋白酶体途径:是真核细胞内重要的蛋白质质控系统,参与调节细胞周期进程,细胞增生与分化,以及信号传导等多种细胞生理过程,因此细胞内蛋白质泛素化降解是蛋白质重要的转录后修饰方式之一。,Ubiquitin:Proteins are usually tagged for selective destruction in proteolytic complexes called proteasomes by covalent attachment of ubiquitin,a small,compact,highly conserved protein.,An isopeptide bond links the terminal carboxyl of ubiquitin to the-amino group of a lysine residue of a condemned protein.,Ubiquitin Isopeptide Bond,Targetprotein,Target lysinee-amino group,Ubcarboxyterminus,Ubiquitination,大量研究证实,这种泛素调节的蛋白质降解过程在生物体中的作用非常重要。通常有30新合成的蛋白质通过泛素化被销毁。因此,可以认为,泛素化是一个把关的过程,如果它把关不严,就会使一些不合格的蛋白质蒙混过关;如果把关过严,又会使合格的蛋白质供不应求。这都容易使生物体出现一系列问题。比如,P53蛋白质可以抑制细胞发生癌变,但如果对P53蛋白质的生产把关不严,就会导致人体抑制细胞癌变的能力下降,诱发癌症。泛素调节的蛋白质降解在生物体中如此重要,因而对它的开创性研究也就具有了特殊意义。目前,在世界各地的很多实验室中,科学家不断发现和研究与这一降解过程相关的细胞新功能。这些研究对进一步揭示生物的奥秘,以及探索一些疾病的发生机理和治疗手段具有重要意义。,泛素化过程(死亡之吻),Phosphorylation,磷酸化是通过蛋白质磷酸化激酶将ATP的磷酸基转移到蛋白的特定位点上的过程。大部分细胞过程实际上是被可逆的蛋白磷酸化所调控的,至少有30%的蛋白被磷酸化修饰。磷酸化的作用位点为蛋白上的Ser,Thr,Tyr残基。在磷酸化调节过程中酶,细胞的形态和功能都发生改变。可逆的磷酸化过程几乎涉及所有的生理及病理过程,如细胞信号转导、肿瘤发生、新陈代谢、神经活动、肌肉收缩以及细胞的增殖、发育和分化等。,Acetylation,乙酰化也是细胞内蛋白质翻译后修饰的一种重要形式。组蛋白等许多蛋白都可以发生乙酰化。,Palmitoylation棕榈酰化,十六(烷)酰化),蛋白质棕榈酰化是蛋白质翻译后脂质共价修饰的一种重要形式,对象主要是胞质蛋白质。对蛋白质功能产生多重影响。,磷酸化,棕榈酰化,