蛋白质化学一级结构及分析.ppt
蛋白质的一级结构及其分析,Peptides and Proteins,氨基酸的多聚物,分子量大小差异极大,可以是2或3个到成千上万个氨基酸残基连接而成。两个氨基酸残基之间通过共价的酰胺键(肽键)连接形成一个二肽;三个氨基酸残基连接成三肽;有限数量的数十个氨基酸残基连接成寡肽;多个氨基酸残基则连接成多肽;蛋白质可以是成千上万个氨基酸残基连接而成。多肽与蛋白质有时混用,但一般将分子量在10000以下的称为多肽。肽或蛋白质的水解是耗能的,由于高的活化能,水解很慢,蛋白质的肽键非常稳定,多数胞内条件下的半衰期为7年。,肽键就是一个氨基酸的-羧基与另一个氨基酸的-氨基脱水缩合形成的键,缩合,水解,氨基酸连接成肽链后,由于氨基酸之间通过一个氨基酸的氨基与另一个氨基酸的羧基缩合脱水,肽链上的一个氨基酸单位被称为残基(residue),带有游离-氨基的一端被称为氨基(末)端(或N端),带有游离-羧基的一端被称为羧基(末)端(或C端)。,H2N-S-G-Y-A-L-COOH,肽链上的解离特性,氨基酸形成肽链后,整个肽链上留下N端可解离的氨基、羧基端可解离的羧基、侧链上能够解离的R基团,中间氨基酸的-氨基和-羧基由于形成肽键而不再对整个肽链的解离有贡献。肽也有特征滴定曲线及特征pI。R基团的解离常数由于氨基酸的氨基和羧基被用于形成肽键成为了残基,其解离在一定程度上会发生改变,这种变化受到-氨基及-羧基失去电荷、与其他R基团的作用、其他能够影响解离常数的环境因子有关。,生物活性的肽及多肽的大小差异极大,不能对生物活性肽及蛋白质的分子量与功能之间作出相关性结论。自然存在的肽的大小从2个到数千个氨基酸残基,甚至最小的肽也能表现出重要的生物学作用,如商业化合成的二肽L-天冬氨酰-L-苯丙氨酸甲酯人工甜味剂-阿斯巴甜(aspartame)或纽特健康糖(NutraSweet),比蔗糖甜200倍。,1965年由科学家JamesSchlatter在研究蛋白质时发现,经16年100多次的科学研究及验证后,阿斯巴甜于1981年(FDA批准)以Nutrasweet(纽特健康糖)品牌正式推出市面。1986年我国卫生部批准可用于除罐头以外的所有食品中。,GSH可被氧化成GSSGGSH作用:在红细胞中作为巯基缓冲剂存在;维持血红蛋白和其它红细胞蛋白质的半胱氨酸残基处于还原状态。,例如,它可防止H2O2将红细胞中血色素的二价铁氧化成三价铁形成高铁血红蛋白。,谷胱甘肽Glutathion(e)(GSH)(GSSG),H2N-Glu-Cys-Gly-COOH,蛋白质中多肽链的长度差异极大,肌联蛋白,一些小肽在极低浓度下发挥作用,一些脊椎动物的激素是小肽,包括催产素(oxytocin)(9个氨基酸残基),由垂体后叶制造,能刺激子宫收缩;舒缓激肽(bradykinin)(9肽)能使呼吸道平滑肌收缩,抑制组织炎症;甲状腺激素释放因子(3肽),下丘脑分泌,能刺激垂体前叶促甲状腺素的释放,它们发挥作用的浓度极低。与许多抗生素一样,一些极毒的毒蘑菇毒素,如鹅膏蕈碱(毒素)(双环的8 肽毒素)(amanitin),对动物有致死作用,与真核生物RNA II聚合酶作用抑制转录。,+H3N-Tyr-Gly-Gly-Phe-Met-COO-+H3N-Tyr-Gly-Gly-Phe-Leu-COO-Met-脑啡肽 Leu-脑啡肽,牛催产素,牛加压素,鹅膏蕈碱(鹅膏毒素、蝇蕈素)的化学结构,蛋白质可以有不同的多肽亚基,一些蛋白质只含有一条简单的多肽链,而另一些蛋白质成为多亚基蛋白质,含有两条或更多条非共价结合的多肽链。多亚基蛋白质的独立的多肽链可以是同一多肽链,也可以是不同的多肽链。有时,不同的亚基形成小的寡聚体(oligomeric),并以此进一步装配。这种小的寡聚体被称为原体(protomers),原体再装配成更大的聚集体。如血红蛋白,四条非共价结合的多肽链,两条一致的链和两条相同的链,可以称为四条多肽亚基的四聚体或者原体的二聚体;天冬氨酸氨甲酰磷酸转移酶由6个调节亚基(R)和6个催化亚基(C)组成,装配时先由1个C亚基和1个R亚基组成一个原体CR,再由6个原体装配成一个有活性的酶。,一些蛋白质的两条或多条多肽链是共价连接的,胰岛素的两条多肽链通过二硫键共价连接,这种情况下,单条多肽链不是亚基,通常被简单地认为是肽链。因此一条多肽链及共价连接的多肽链不是四级结构。,从蛋白质的大小估算氨基酸残基数,可以从一个不含有其他化学基团的蛋白质分子估算其中的氨基酸残基的大概数目,用蛋白质的分子量除以110,即为组成氨基酸的数目。20种氨基酸的平均分子量为138,较小的氨基酸在多数蛋白质中的丰度高,如果考虑不同氨基酸在蛋白质中出现的比例,平均分子量只有128,形成肽键时失去一分子水(18),因此,蛋白质分子中氨基酸残基的平均分子量为128-18=110。,多肽具有特征性的氨基酸组成,多肽或蛋白质以酸水解产生游离-氨基酸的混合物。当完全水解时,每一种类型的蛋白质产生一种特征性的氨基酸比例或混合物。20种氨基酸几乎从不以相同的比例出现在一个蛋白质中,有高有低,甚至有的只出现一次或根本不出现。,有些蛋白质含有非氨基酸的化学基团,很多蛋白质,如核糖核苷酸酶、胰凝乳蛋白酶,仅含有氨基酸残基,没有其他化学基团-单纯蛋白质。但有些蛋白质,除氨基酸残基外,还含有永久连接的化学组成,被称为复合蛋白质,非氨基酸连接的化学基团被称为辅基(prosthetic group)。复合蛋白质的分类根据辅基的化学特性,如脂蛋白含有脂、糖蛋白含有糖、金属蛋白含有特异的金属。有些蛋白质甚至含有不止一种辅基,辅基通常对蛋白质的功能起重要作用。,铁蛋白,酪蛋白,质体蓝素,肽的物理化学性质,肽末端-羧基pKa值比游离AA中的大,而肽末端-氨基pKa值比游离AA中的小,侧链R基的差别不大。等电点(两性)。酸碱性质取决于:-羧基、-氨基、侧链基团的解离具有双缩脲(biuret)反应(H2N-CO-NH-CO-NH2)-Pr特有的反应(与硫酸铜-氢氧化钠溶液产生紫红色或蓝紫色颜色反应,可用于肽和蛋白质定量测定)。,1952年丹麦人Linderstrom-Lang最早提出蛋白质的结构可以分成四个层次:primary structure 一级结构:氨基酸序列 secondary structure 二级结构:螺旋,折叠 tertiary structure 三级结构:所有原子空间位置 quarternary structure 四级结构:蛋白质多聚体 1969年正式将一级结构定义为氨基酸序列和二硫键的位置。介于二级结构和三级结构之间还存在超二级结构(二级结构的组合)和结构域(在空间上相对独立的三维结构的实体)这两个层次。,蛋白质的结构层次,肽键将氨基酸与氨基酸头尾相连,肽 键,肽键的特点是氮原子上的孤对电子与羰基具有明显的共轭作用。组成肽键的原子处于同一平面。肽键中的C-N键具有部分双键性质,不能自由旋转。在大多数情况下,以反式结构存在。,肽键平面,6个原子处于同一肽键平面上,一般C=N双键(0.128nm),肽键的C及N周围三个键角之和均为360,两个肽平面以一个C为中心发生旋转,两个肽键平面之间的-碳原子,可以作为一个旋转点形成二面角(dihedral angle)。二面角的变化,决定着多肽主键在三维空间的排布方式,是形成不同蛋白质构象的基础。,二面角(Dihedral Angle),绕C-N键轴旋转的二面角(C-N-C-C)称为,绕C-C键轴旋转的二面角(N-C-C-N)称为,原则上和可以取-180+180之间的任一值,这样多肽链主链的各种可能构象都可用和这两个二面角或扭角来描述。,研究蛋白质的一级结构,就是要将氨基酸的排列顺序搞清楚。二十世纪四十年代起,许多人不遗余力地从事蛋白质的一级结构研究,Sanger第一个将一个蛋白质(胰岛素)的所有氨基酸的排列顺序通过高度的实验技巧加以确定。,蛋白质一级结构的测定,历史上第一个被确定氨基酸序列的肽(蛋白质)胰岛素insulin,胰岛素的历史 第一个生化药物,最小的蛋白质,由A链(21 AA)和B链(30 AA)组成;胰腺细胞分泌的一种激素,告诉细胞往里面运输糖、氨基酸、K+;1921年Banting&Best 从胰腺中抽提出了有活性的胰岛素,1923年Banting&Macleod获Nobel医学奖;194353年,Sanger确定了牛胰岛素的一级结构,1958年获得Nobel化学奖;1981年,Berg(因DNA重组技术得奖)在大肠杆菌中表达了人胰岛素。,科学怪才 Fredrick Sanger,Frederick Sanger(1918-)is a British molecular biologist who was working on problems related to the determination of the structure of proteins.His studies resulted in the determination of the structure of insulin in 1953;for this discovery he received Nobel Prize in Chemistry in 1958.In 1965,he developed the chain termination method,also known as the Sanger method.He later received another Nobel Prize in Chemistry in 1980 for contributions concerning the determination of base sequences in nucleic acids.In 1992,the Sanger Centre in Cambridge,named after Frederick Sanger,was founded by the Wellcome Trust and the British Medical Research Council,the purpose of which is stated on their website as“to provide a major focus in the UK for mapping and sequencing the human genome,and genomes of other organisms.,两获诺贝尔奖(仅4人),唯一两获诺贝尔化学奖。,Sanger试剂(FDNB)标记N末端,ABCDE*ABCDE*A,*AB,*ABC,*ABCD,*ABCDE*A,*A+B,*A+B+C+D+E*A,*A+*B,*A+*B+*C+*D+*E 1 2 3 4 5 结论:A B C D E,FDNB,FDNB,完全水解,部分水解,纸层析、薄层层析帮助确定氨基酸种类,最终靠重叠法确定整个肽链,多肽 氨基酸序列,历史上第一个被确定氨基酸序列的酶(1960年)核糖核酸酶ribonuclease,124 AA,Moore&Stein,氨基酸自动分析仪,Edman降解法,Sanger法,1958年设计,获1972年诺贝尔化学奖,全自动氨基酸分析仪,氨基酸分析仪是进行氨基酸分离、衍生和检测的自动化分析系统,广泛用于制药、食品、饲料、农业、育种、医学研究、临床诊断和地质考察等领域。原理:阳离子交换分离、柱后茚三酮衍生、可见光光度法测定。,蛋白质一级结构的经典分析方法,1.样品必需纯(97%以上);2.测定蛋白质的分子量;3.测定蛋白质由几个亚基组成;4.测定蛋白质的氨基酸组成;并根据分子量计算每种氨基酸的个数。5.测定水解液中的氨量,计算酰胺的含量。,测定蛋白质一级结构的要求,蛋白质和多肽氨基酸顺序的测定,(1)、肽链的拆开和分离(2)、测定蛋白质分子中多肽链的数目(3)、二硫键的断裂(4)、测定每条多肽链的氨基酸组成,并计算出氨基酸成分的分子比(5)、N端、C端的测定(6)、多肽链断裂(7)、测定每个肽段的氨基酸顺序(8)、确定肽段在多肽链中的次序(9)、确定原多肽链中二硫键的位置,测定每条多肽链的氨基酸组成,并计算出氨基酸成分的分子比。,多肽链的拆分,由多条多肽链组成的蛋白质分子,必须先进行拆分。几条多肽链借助非共价键连接在一起,称为寡聚蛋白质,如血红蛋白为四聚体,烯醇化酶为二聚体。可用8 mol/L尿素或6 mol/L盐酸胍处理,即可分开多肽链(亚基)。,测定蛋白质分子中多肽链的数目,通过测定末端氨基酸残基的摩尔数与蛋白质分子量之间的关系,即可确定多肽链的数目。,蛋白质的酸水解,常用6 mol/L HCl或4 mol/L H2SO4在105-110条件下进行水解,反应时间约20小时。优点是不容易引起水解产物的消旋化。缺点是Trp被沸酸完全破坏;含有羟基的氨基酸如Ser或Thr有一小部分被分解;Asn和Gln侧链的酰胺基被水解成了羧基。,蛋白质的碱水解,一般用5 mol/L NaOH煮沸10-20小时。由于水解过程中许多氨基酸都受到不同程度的破坏,产率不高。部分的水解产物发生消旋化。该法的优点是Trp在水解中不受破坏。,蛋白质的酶法水解,目前用于蛋白质肽链断裂的蛋白水解酶(proteolytic enzyme)或称蛋白酶(proteinase)已有十多种。应用酶水解多肽不会破坏氨基酸,也不会发生消旋化。水解的产物为较小的肽段。内切酶:胰蛋白酶、胰凝乳(糜)蛋白酶、胃蛋白酶、嗜热菌蛋白酶外切酶:羧肽酶和氨肽酶,颌下腺蛋白酶,胰蛋白酶,胰凝乳蛋白酶,金黄色葡萄球菌V8蛋白酶,Asp-N-内切酶,胃蛋白酶,溴化氰,胰蛋白酶(trypsin),R1=Lys(K)和Arg(R)专一性较强,水解速度快R2=Pro(抑制),水解位点,胃蛋白酶(pepsin),R1和/或R2Phe(F)、Trp(W)、Tyr(Y)、Leu(L)及其它疏水性AA水解速度较快 R1=Pro(抑制)pH2,糜蛋白酶/胰凝乳蛋白酶(chymotrypsin),水解位点,R1=Phe(F)、Trp(W)Tyr(Y)等疏水性AALeu、Met和His稍慢R2=Pro(抑制)pH8-9,嗜热菌蛋白酶(thermolysin),R2=Phe(F)、Trp(W)、Tyr(Y)、Leu(L)、Ile(I)、Met(M)、Val(V)及其它疏水性强的AA水解速度较快。,R2=Pro或Gly,不水解R1或R3=Pro,抑制水解,水解位点,肽键的专一性水解(化学法),化学法:(1)BrCN-Met的C端,(2)NH2OH(羟胺)断裂:较专一性断裂Asn-Gly之间的肽键 Asn-Leu及Asn-Ala键也能部分断裂,末端氨基酸的测定,多肽链端基氨基酸分为两类:N-端氨基酸(amino-terminal)和C-端氨基酸(carboxyl-terminal)。在肽链氨基酸顺序分析中,最重要的是N-端氨基酸分析法。,N末端:1、Sanger法2、Edman法3、DNS-Cl4、酶降解法,C末端:1、肼解法2、酶降解法3、硼氢化锂法,二硫键的断裂,几条多肽链通过二硫键交联在一起,可在8 mol/L尿素或6 mol/L盐酸胍存在下,用过量的-巯基乙醇处理,使二硫键还原为巯基,然后用烷基化试剂保护生成的巯基,以防止它重新被氧化。,二硫键的切割与保护,1、过甲酸performic acid 不可逆,巯基被氧化为 CH2SO3H2、还原氧化 不可逆 巯基乙醇,DTT 碘乙酸等 S-CH2-COOH3、亚硫酸分解Sulfitolysis 可逆 R1-S-S-R2 HSO3-R1-S-SO3H+R2-S-SO3H,巯基(-SH)的保护,苯乙酰氯/碘乙酰胺,多肽链断裂成多个肽段,可采用两种或多种不同的断裂方法(如酶解、化学断裂等)将多肽样品断裂成两套或多套肽段或肽碎片,并将其分离开来。,测定每个肽段的氨基酸顺序,肽段的的分离纯化:凝胶过滤、凝胶电泳和HPLC法。,一级结构分析的经典三步曲,蛋白质一级结构测定的步骤,1、蛋白质的分离纯化 Purification2、二硫键的拆分与保护 S-S cleavage&blocking3、(亚基分离)Subunit separation4、多种方法的部分水解 Partial hydrolysis5、分离水解后得到的多肽 Peptide separation6、测序 Sequencing7、重叠 Overlapping8、二硫键位置的确定 Disulfide bond po.,Cys 容易引起的问题,1、Cys受空气氧化而形成Cys-Cys2、Cys和Cys-Cys会发生交换反应3、分析氨基酸组成时,Cys容易受修饰而 不利于定量4、S-S键使蛋白酶难于作用5、Edman反应中不能形成稳定的PTH-AA6、多条肽链以S-S键相连,拥有两个以 上N末端,无法用Edman法测序,N端的测定方法,1、Sanger法2、Edman法3、Dansyl chloride/Edman法4、酶降解法,Edman 降解法(I),DABITC:有色Edman试剂在Edman试剂上加发色基团,pH 9,CF3COOH/无水,DABITC:4-N,N-二甲氨基偶氮苯4乙内酰硫脲,Edman 降解法(II),无冕英雄 Pehr Victor Edman,瑞典人,1946-47年在美国留学时想到改进1930 年Abderhalden 60年代后期Moore&Stein利用该反应测定了RNase的一级结构,遗憾的是Edman没有和他们分享Nobel化学奖.,氨基酸的鉴定、分离纯化,PTH-AA,Edman降解与DNS-Cl法的结合,其他序列测定法,Dicarboxypeptidase(DCP)法 序列 ABCDEFGHIJK-酶解 AB,CD,EF,GH,IJ,K Edman循环后再酶解 BC,DE,FG,HI,JK,-质谱法,质谱法 Edman循环后看分子量的变化,1、肼法2、3H标记法3、酶降解法 4、PFPA/PFPAA法,C端的测定方法,蛋白质与无水肼加热-NH-CH-CONH-CH-COOH|Rx Ry-+-+NH-CH-CONH-NH2+NH2-CH-COOH|Rx Ry,肼(hydrazine)法测定,NH2NH2,100,510h,溶于有机溶剂而被除去,多种方法确定,蛋白质吡啶/3H2O/醋酸酐(3:1:3,v/v)蛋白质C末端C原子会被3H置换,C端的氚3H标记法测定,室温 12 h,利用外切蛋白水解酶(exo-peptidase)将肽链的氨基酸从N端(氨肽酶,aminopeptidase)或C端(羧肽酶,carboxypeptidase)一个接一个游离出来,在不同时间取样进行分析,根据所游离的氨基酸的摩尔数的多少来判断氨基酸的排列顺序。,酶解法末端测序,PFPA:pentafluoropropionic acid C2F5COOHPFPAA:pentafluoropropionic acid anhydride C2F5-COOOC-C2F5 这两种物质在酸性条件下低温反应,可以从C端一个接一个地切除氨基酸,与质谱相结合就可以确定C端多个氨基酸的序列。1.Eur.J.Biochem.206,691-696(1992)2.Chemistry Letters,235-238(1992),PFPA和PFPAA法C端测序,二硫键位置的确定,如果蛋白质分子中存在链间或链内二硫键,在多肽链的氨基酸顺序分析后,需要对二硫键的位置加以确定。确定二硫键的位置一般采用胃蛋白酶水解含二硫键的蛋白质,因酶的专一性较低、切点多、生成的肽段包括含有二硫键的肽段较小,便于后面的分离及鉴定;酶的作用pH在酸性范围(-2),有利于防止二硫键发生交换。,胃蛋白酶处理没有断开二硫键的多肽链经电泳分离各肽段用过甲酸断开二硫键,含有-S-S-的肽段带电性质发生变化,转向90二次电泳,曾含二硫键的肽段迁移率发生变化然后同其它方法分析的肽段进行比较,确定二硫键的位置。,胃蛋白酶最适pH约2,此时二硫键不断开专一性低、肽段短,采用对角线电泳(Brown及Hartlay,1966),将水解肽段点样在滤纸上,pH6.5条件进行第一向电泳,肽段按大小及电荷不同被分离。然后将滤纸暴露在过甲酸蒸气中,使-S-S-断裂,含二硫键的肽段被氧化成一对含半胱氨磺酸的肽段。将滤纸旋转90度,在与第一向完全相同的条件下进行第二向电泳。结果是大多数肽段的迁移率未变,将位于滤纸的一条对角上。而含半胱氨磺酸对成对肽段比原来含二硫键的肽小并所带负电荷增加,结果偏离对角线。肽斑用茚三酮显色确定。将每对含半胱氨磺酸对肽段分别取下(未用茚三酮显色),进行氨基酸序列分析,再与多肽的氨基酸顺序比较,可推断二硫键在链间或链内的位置。,对角线电泳技术,a)混合肽段点到滤纸。b)第一向电泳,将产物分开。c)用过甲酸将二硫键打断d)进行第二向电泳e)偏离对角线的样品就是含二硫键的片段,Diagonal Electrophoresis,断裂蛋白质及测定肽段的序列。首先测定氨基酸组成及N端氨基酸残基;如有二硫键,在肽链断链前打开二硫键;胰蛋白酶水解及肽段分析;溴化氰水解及肽段分析;拼接整个肽段序列。,蛋白质序列测定的其他方法,其他方法可以用于蛋白质的序列分析,质谱法可以在几分钟内测定短肽(20-30 AA)的序列。DNA的快速测定方法的发展、遗传密码分析、基因的分离技术可以从编码基因的核苷酸序列来分析蛋白质的多肽序列。用于分析蛋白质和DNA的技术方法是互补的,获得基因后,DNA的序列分析比蛋白质序列分析要快且准确,现在多数蛋白质的序列都是通过这种方法测定的。如果基因没有获得,蛋白质序列的直接分析是必需的,并且能获得DNA序列中没有的信息(如二硫键的位置),蛋白质N末端的序列能加快相应基因的分离。,分离纯化蛋白质,酶切部分水解后分离短肽,对短肽进行测序,构建cDNA文库,根据序列设计探针,筛选cDNA文库,根据cDNA序列推测蛋白质的一级结构,N末端和C末端的测序除了用于未知蛋白质的一级结构的研究以外,最常用于基因工程表达产物的末端分析。,蛋白质序列数据库,