氨基酸和蛋白质一级结构.ppt
1氨基酸和蛋白质的一级结构1.1 蛋白质是由二十种不同的氨基酸构成的 1.1.1 二十种氨基酸可以按其侧链分类 1.1.2氨基酸的离子状态取决于环境的pH 1.1.3 使用离子交换层析可将各种氨基酸分开 1.1.4 氨基酸可进行特征的化学反应1.2蛋白质中的氨基酸是通过肽键连接的 1.3肽可以化学合成1.4蛋白质可以通过各种生物化学技术纯化 1.4.1柱层析常用于蛋白质的分离纯化 1.4.2电泳分离蛋白质是根据蛋白质在电场中的迁移率1.5蛋白质的一级结构就是蛋白质的氨基酸序列 1.5.1蛋白质的氨基酸组成可以定量确定 1.5.2 Edman降解方法常用于氨基酸序列的测定 1.5.3大蛋白被水解成肽段后再测序 1.5.4蛋白质一级结构的比较可以揭示进化关系,1.1 蛋白质是由二十种不同的氨基酸构成的 蛋白质是由氨基酸构成的聚合物,所有生物都是利用这20种氨基酸作为构件组装成各种蛋白质分子的。因此这20种氨基酸被认为是通用的或是标准的氨基酸。尽管氨基酸的种类有限,但由于氨基酸在蛋白质中连接的次序以及氨基酸数目的不同,所以可以组装成几乎无限的不同种类的蛋白质。20种氨基酸都被称之-氨基酸,因为-氨基酸分子中的-碳(分子中第2个碳,C)结合着一个氨基和一个酸性的羧基,此外C还结合着一个H原子和一个侧链基团(用R表示)。每一种氨基酸的R都是不同的,侧链上的碳依次按字母命名为、和碳,分别指的是第3、4、5和6位碳。,表1.1 20种标准氨基酸的英文名称及简写符号,1.1.1 20种标准氨基酸可以按其侧链分类 20种氨基酸按照它们的侧链基团可以分为:6种脂肪族、3种芳香族、2种含硫、2种羟基、3种碱性、2种酸性和2种酰胺氨基酸。1、R为脂肪族基团的氨基酸 甘氨酸的结构在20种氨基酸中最简单,因为它的侧链是个氢原子,所以甘氨酸的-碳不是手性碳。丙氨酸(-氨基丙酸)的侧链是一个简单的甲基;缬氨酸(-氨基异戊酸)的侧链是一个含有支链的3碳侧链;亮氨酸(-氨基异己酸)和异亮氨酸(-氨基-甲基戊酸)都是含有支链的4碳侧链。要注意的是,异亮氨酸分子中的-碳和-碳都是不对称碳。所以异亮氨酸存在着4种可能的立体异构体:L-异亮氨酸,D-异亮氨酸,L-别构异亮氨酸,和D-别构异亮氨酸(别构是指一个异构形式),脯氨酸(-吡咯烷基-羧酸)明显地不同于其它19种氨基酸,它有一个环形的饱和烃侧链,结合在-氨基的氮和-碳上。所以严格地讲,脯氨酸是一个亚氨基酸,因为它含有一个二级氨基,而不是一级氨基。不过在蛋白质中发现的脯氨酸也象其它氨基酸一样,它的-碳也是手性碳。脯氨酸的杂环吡咯烷环限制多肽的几何构型,有时会在多肽链中引进一个转折的变化。,2、R为芳香族基团的氨基酸 苯丙氨酸(-氨基-苯丙酸)是一个含有苯基的氨基酸。酪氨酸(-氨基-对羟基苯丙酸)的结构类似于苯丙氨酸,称之对羟基苯丙氨酸。酚是个比较弱的酸,所以酪氨酸侧链的pKa值为10.5。色氨酸(-吲哚-氨基丙酸)的侧链带有一个双环的吲哚基,所以色氨酸又称之吲哚丙氨酸。三种芳香族氨基酸都吸收紫外光,在中性pH条件下,色氨酸和酪氨酸的紫外吸收峰在280nm,而苯丙氨酸的在260nm,大多数蛋白质中都含有色氨酸和酪氨酸或其中的一种,所以溶液中280nm吸收的测量常用来估算蛋白质的浓度。3、R为含硫基团的氨基酸 蛋氨酸和半胱氨酸是两个含硫氨基酸。蛋氨酸(-氨基-甲硫基丁酸)是个疏水氨基酸,它的侧链上带有一个非极性的甲基硫醚基,不过其中的硫原子是亲核的。半胱氨酸(-氨基-巯基丙酸)侧链上含有一个巯基(-SH),所以又称之巯基丙氨酸。虽然半胱氨酸的侧链显得有点疏水性,但-SH也是一个高反应性的基团。,4、R为含醇基基团的氨基酸 丝氨酸和苏氨酸是两个侧链含有-羟基的不带电荷的氨基酸:苏氨酸(-氨基-羟基丙酸)、丝氨酸(-氨基-羟基丁酸)。尽管丝氨酸的羟甲基(-CH2OH)在水溶液看不出离子化,但这个醇可以参与很多酶的活性部位反应,就象已被离子化了一样。要注意,苏氨酸也象异亮氨酸一样,具有两个手性碳原子,即-碳和-碳原子,通常出现在蛋白质中的L-苏氨酸只是4种立体异构体中的一种,5、R为碱性基团的氨基酸 有5种氨基酸在pH7时它们的侧链基团带有电荷,其中有3种是带正电荷的碱性R基团,另外2种是带负电荷的酸性R基团。组氨酸、赖氨酸和精氨酸它们都带有亲水性的含氮碱基R基团。组氨酸(-氨基-咪唑基丙酸)的侧链有一个咪唑环,所以又称之咪唑丙氨酸。咪唑基是可以离子化的(pKa6.0)。赖氨酸(,-二氨基己酸)是一个双氨基酸,含有-和-氨基。在中性pH,-氨基是以碱性氨离子(-CH2-NH3)形式存在的,在蛋白质中通常带正电荷。精氨酸(-氨基-胍基戊酸)是20种氨基酸中碱性最强的氨基酸,它的侧链胍基离子的pKa值最高(pKa12.5)。,6、R为酸性基团的氨基酸 天冬氨酸(-氨基丁二酸)和谷氨酸(-氨基戊二酸)是二羧基氨基酸,除了含有-羧基外,天冬氨酸还含有-羧基,谷氨酸还含有-羧基。由于两个氨基酸的侧链在pH7时都离子化了,所以在蛋白质中是带负电荷的,这两个氨基酸经常出现在蛋白质分子表面上,谷氨酸的单钠盐是调味品味精。7、R为含酰胺基团的氨基酸 天冬酰胺(-氨基-羧基丙酰胺)和谷氨酰胺(-氨基-羧基丁酰胺)分别是天冬氨酸和谷氨酸的酰胺化产物。尽管这两个氨基酸的侧链是不带电荷的,但它们的极性很强,也经常出现在蛋白质分子的表面,它们可以和水相互作用。另外这两种氨基酸的酰胺基可以与其它的极性氨基酸的侧链上的原子形成氢键。必需和非必需氨基酸:以上氨基酸分类完全是根据侧链的性质分类的,从营养学角度又可将氨基酸分为必需和非必需氨基酸。必需氨基酸包括赖氨酸、苯丙氨酸、蛋氨酸、亮氨酸、异亮氨酸、缬氨酸、苏氨酸、色氨酸、组氨酸和精氨酸,其中组氨酸和精氨酸,人虽然能合成,但效率低,尤其在婴幼儿时期,需要由外界供给。非必需氨基酸是其余的10种氨基酸:甘氨酸、丝氨酸、半胱氨酸、酪氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、脯氨酸和丙氨酸。,5,6,7,8,1.1.2氨基酸的离子状态取决于环境的pH 表1.2 给出了25下游离氨基酸的酸性和碱性基团的pKa值和氨基酸的等电点(pI)。,氨基酸的-COOH基是个弱酸,利用Henderson-Hasselbalch方程可以计算任何pH下离子化基团的比例。共轭碱pHpKalog 弱酸从表1.2可以看出,游离氨基酸的-COOH的pKa值的范围是1.8至2.5。对于一个典型的氨基酸它的-COOH的pKa值大约是2,羧酸盐对羧酸的比是100000:1,所以在中性pH条件下,占优势的成分是羧酸盐离子。RCOO7.02.0log RCOOH-氨基的pKa值的范围是8.7至10.7。它的共轭碱(游离的胺-NH2)对共轭酸(质子化的胺-NH3)的比,在pH7时为1:1000。计算表明,在中性pH条件下,游离氨基酸主要是以兼性离子形式存在的。所以将一个氨基酸画成带有-COOH和-NH2基团的形式是不合适的。因为不存在这样一种pH,即在这一pH下,-COOH和-NH2都占优势。脯氨酸的氨基(pKa10.6)在中性pH条件下也是质子化的碱基形式,虽然侧链与-氨基结合,脯氨酸在pH7时仍是一种兼性离子。,通过氨基酸的滴定曲线可以确定氨基酸的各个解离基团的pKa值。图1.4给出了丙氨酸和组氨酸的滴定曲线。丙氨酸有两个可解离基团,-COOH和-NH3,它们的pKa值分别是2.4和9.9,每一个值都是位于滴定曲线缓冲区的中心。组氨酸有3个可解离基团,即-COOH、-NH3和侧链基团咪唑基,pKa值分别是1.8、6.0和9.3,也都是处于缓冲区的中心。,1.1.3 使用离子交换层析可将各种氨基酸分开 层析(chromatography)也称之色谱(来自Chroma),其基本原理是分析样品作为流动相流过固相时,样品中的各个成分与固相进行着不同程度的相互作用,使得样品中的各个成分在固相中的迁移率产生了差别,从而达到分离样品的目的。根据固相与样品中各个成分之间相互作用的种类的不同,又有离子交换层析、分子筛层析和吸附层析等各种层析方法。通常都是将固相装到一个柱子里,然后使流动相流过柱子(有时需要加压力),这样的层析方法叫做柱层析(column chromatography)。如果被分离的样品中各个成分受溶液pH的影响,有时带正电荷,有时带负电荷,此时就可利用离子交换层析方法进行样品的分离。离子交换层析的固相是离子交换体,其中有离子交换树脂、离子交换纤维素、离子交换葡聚糖。通常是以树脂、或是纤维素、或是葡聚糖作为基质,这些基质具有网状结构,将带电基团引入到基质上托纬闪死胱咏换皇髦菀氲拇缁挪煌址治衾胱咏换惶搴鸵趵胱咏换惶濉 引入SO3Na 或COOH基团的叫做阳离子交换体;引入N(C2H5)Cl基团的叫做阴离子交换体。,分离氨基酸常用的是带有耐酸性非常强的磺酸根SO3Na(以盐的形式出现)的强阳离子交换树脂。首先将这种树脂填充到柱子中,然后注入含有样品的流动相,样品中含有阳离子成分X,通过静电吸引,与树脂中的带电基团相互作用,结果X与Na交换,即发生阳离子交换后,形成SO3X。,1.1.4 氨基酸可进行特征的化学反应 氨基酸的-氨基、-羧基以及氨基酸的各种侧链基团可进行很多种化学反应。氨基酸与茚三酮(ninhydrin)的反应是一个检测和定量氨基酸和蛋白质的重要反应。茚三酮在弱酸性溶液中与氨基酸共热,所有具有游离氨基的氨基酸都生成紫色化合物(470)(图1.7)。然而由于脯氨酸是一个亚氨基酸,所以与茚三酮反应生成的是黄色化合物(440)。,有几种与氨基酸的氨基反应的试剂常用来鉴定蛋白质和多肽的N-末端氨基酸残基。2,4-二硝基氟苯(2,4-dinitrofluorobenzene,DNFB)也叫做Sanger试剂。DNFB在弱碱性溶液中与氨基酸发生取代反应,生成黄色化合物二硝基苯基氨基酸(dinitro phenyl amino acid,DNP氨基酸)(图1.8a)。,丹磺酰氯(dansyl chloride)是5-二甲基氨基萘-1-磺酰氯(5-dimethylaminonaphthalene-1-sulfonyl chloride)的简称。丹磺酰氯与氨基酸反应生成荧光性质强和稳定的磺胺衍生物(图1.8b),也常用于多肽链的N末端氨基酸的鉴定。,苯异硫氰酸酯(phenylisothiocyanate,PITC)在弱碱性条件下,与氨基酸反应生成苯乙内酰硫脲(phenylthiohydantoin,PTH)衍生物,即PTH-氨基酸(图1.8c),此反应又称之Edman反应,该反应是蛋白质或多肽氨基酸序列测定常用的反应。,1.2蛋白质中的氨基酸是通过肽键连接的 一个氨基酸的-羧基与另一个氨基酸的-氨基缩合,通过形成的酰胺键将两个氨基酸连接在一起,这个酰胺键称之肽键(peptide bond)(图1.9),氨基酸缩合生成的产物称之肽(peptide)。,1.3肽可以化学合成 多肽合成的基本过程是本世纪初由Emil Fischer设计的,称为液相合成法,肽链从N端向C端方向延伸。首先一个氨基酸的羧基和另一个氨基酸的氨基被保护基团封闭,然后参与肽键形成的羧基被激活,如形成脂酰氯,或酸酐。激活的羧酸受到游离氨基的亲电攻击形成一个封闭的二肽(图1.11)。最后通过水解有选择地除去保护基团而留下一个完整的肽键。,1.4蛋白质可以通过各种生物化学技术纯化利用蛋白质的溶解度、净电荷、大小以及与配体结合特异性上的微小差异。有透析、凝胶过滤、离子交换层析、亲和层析、电泳(垂直板电泳、等电聚焦电泳、双向电泳)等分离纯化方法。透析,离子交换层析 离子交换层析同样可以用于蛋白质的分离纯化。由于蛋白质也有等电点,当蛋白质处于不同的pH条件下,其带电状况也不同。阴离子交换基质结合带有负电荷的蛋白质,所以这类蛋白质被留在柱子上,然后通过提高洗脱液中的盐浓度等措施,将吸附在柱子上的蛋白质洗脱下来。结合较弱的蛋白质首先被洗脱下来。凝胶过滤层析(Gel-filtration chromatography)凝胶层析是按照蛋白质分子量大小进行分离的技术,又称之凝胶过滤,分子筛层析或排阻层析。单个凝胶珠本身象个“筛子”。不同类型凝胶的筛孔的大小不同。,C 亲和层析(Affinity chromatography)这是一种最有选择性的柱层析,其原理是依赖于蛋白质和它的配体(ligand)之间的相互作用来分离的。配体通常指的是能与另一个分子或原子结合(一般是非共价结合)的分子、基团、离子、或原子。但在亲和层析中,配体是通过共价键先与基质结合,配体可以是酶结合的一个反应物或产物,或是一种可以识别靶蛋白的抗体。当蛋白质混合物通过装有连接了配体的基质的亲和层析柱时,只有靶蛋白可以特异地与基质结合,而其它没有结合的蛋白质首先被洗脱下来。特异结合在基质上的靶蛋白最后可以用含有高浓度的自由配体的溶剂。所以有时只用亲和层析就可使蛋白质的纯化提高1000至10000倍。,1.4.2电泳分离蛋白质是根据蛋白质在电场中的迁移率 电泳分离蛋白质是根据蛋白质在电场中的迁移的差别达到分离目的的。蛋白质样品加到一块预先制好的凝胶介质上,只要在凝胶的两端加上电场,就可以达到分离蛋白质的目的,这样的电泳称之凝胶电泳(gel electrophoresis)。凝胶可以是淀粉凝胶(starch gel)、琼脂糖凝胶(agarose gel)和聚丙烯酰胺凝胶(polyacrylamide gel)。一般凝胶介质中的pH被维持在碱性区,目的是使大多数蛋白质都带有负电荷,这样它们可以向阳极迁移。蛋白质的迁移与蛋白质的质量和带电荷的多少有关,我们介绍其中常用的几种主要的电泳技术。,A SDS-聚丙烯酰胺凝胶电泳(SDS-polyacrylamide gel electrophoresis,SDS-PAGE)使用含有一种去污剂十二烷基硫酸钠(sodium dodecyl sulfate,SDS)和还原剂(通常为巯基乙醇)的样品处理液对蛋白质样品进行处理(一般煮沸35分钟),通过加热和SDS可以使蛋白质变性,多亚基的蛋白质也将解离为单亚基。同时还原剂可以切断蛋白质中的任何一个二硫键(使二硫键还原)。经过这样处理的样品中的肽链都是处于无二硫键连接的,分离的状态。由于SDS是带有负电荷的分子,同时它有一个长的疏水尾巴,SDS通过疏水尾巴与肽链中的氨基酸的疏水侧链结合,结合SDS的比率大约是一个蛋白质分子中每两个氨基酸残基结合一分子的SDS。,B 等电聚焦电泳(Isoelectric focusing electrophoresis,IFE)等电聚焦电泳是一种电泳的改进技术,实际上是利用聚丙烯酰胺凝胶内的缓冲液在电场作用下在凝胶内沿电场方向制造一个pH梯度。所用的缓冲液是低分子量的有机酸和碱的混合物,该混合物称之两性电解质(ampholytes)。当蛋白质样品在这样的凝胶上电泳时,每种蛋白质都将迁移至与它的pI 相一致的pH处(图1.18),具有不同pI的各种蛋白质最后都迁移至凝胶中相应的pH处,达到分离的目的。C 双向电泳(two-dimensional electrophoresis)如果将等电聚焦电泳与SDS-PAGE结合起来,就是分辨率更高的一种双向电泳了(图1.19)。双向电泳后的凝胶经染色蛋白呈现二维分布图,水平方向反映出蛋白在pI上的差异,而垂直方向反映出它们在分子量上的差别。所以双向电泳可以将分子量相同而等电点不同的蛋白质以及等电点相同而分子量不同的蛋白质分开。,1.5蛋白质一级结构就是它的氨基酸序列 从1953年Sanger测定了胰岛素的全部氨基酸序列。每一种蛋白质都具有唯一的氨基酸序列。实际上蛋白质的氨基酸序列是由DNA决定的。测定蛋白质的氨基酸序列具有重要意义,第一,测定蛋白质的氨基酸序列是阐明蛋白质生物活性的分子基础。其次,研究表明蛋白质的一级结构决定它的空间结构。第三,氨基酸序列的改变可以产生异常功能和疾病,例如致命的镰刀形红细胞贫血病。因此序列测定成为分子病理学的一个部分。最后蛋白质的氨基酸序列能指明它的进化史。,1.5.1蛋白质的氨基酸组成可以定量确定 首先通过酸水解破坏蛋白质的肽键,典型酸水解的条件是:真空条件下,110,用6M盐酸水解16至72小时。水解的混合物(水解液)进行柱层析,通过柱层析可以将水解液中的每一个氨基酸分离出来并被定量,这一过程称之氨基酸分析(amino acid analysis)。其中一种氨基酸分析方法是用苯异硫氰酸酯(PITC)处理蛋白质水解液(pH9),生成苯硫脲(PTC)-氨基酸衍生物,PTC-氨基酸混合物经HPLC(细硅胶柱),按照它们的疏水特性被分离。分离的每个PTC-氨基酸经测量254nm(PTC-氨基酸吸收峰波长)光吸收,确定它们的浓度。图1.20给出了PTC-氨基酸混合物HPLC的洗脱图,图中的峰用各个氨基酸的吸收峰,用标准的单个字母表示。由于存在于水解液中每个氨基酸的量是与洗脱峰的面积成比例的。,1.5.2 Edman降解方法常用于氨基酸序列的测定 P.Edman降解测序主要涉及耦联、水解、萃取和转换等4个过程。首先使用苯异硫氰酸酯(PITC)在pH9.0的碱性条件下对蛋白质或多肽进行处理,PITC与肽链的N-端的氨基酸残基反应,形成苯氨基硫甲酰(PTC)衍生物,即PTC-肽。然后PTC-肽用三氟乙酸处理,N-端氨基酸残基肽键被有选择地切断,释放出该氨基酸残基的噻唑啉酮苯胺衍生物。接下来将该衍生物用有机溶剂(例如氯丁烷)从反应液中萃取出来,而去掉了一个N-端氨基酸残基的肽仍留在溶液中。萃取出来的噻唑啉酮苯胺衍生物不稳定,经酸作用,再进一步环化,形成一个稳定的苯乙内酰硫脲(PTH)衍生物,即PTH-氨基酸(图1.21)。,1.5.4蛋白质一级结构的比较可以揭示进化关系 蛋白质一级结构是由编码它的基因确定的,蛋白质一级结构之间的差别可以反映出进化关系。来自亲缘关系密切的蛋白质的氨基酸序列非常类似,一级结构中氨基酸残基序列差别越大,反映出它们的亲缘关系就较远。细胞色素c是由一条含有104至111个氨基酸残基的多肽链组成的,由于细胞色素c几乎存在于所有的需氧生物中,所以通过在分子水平上比较来自不同种属的细胞色素c,可以看出它们之间的进化关系。图1.24就是根据不同种属的细胞色素c的氨基酸残基的差别绘制出的进化树,形成的每一个树杈的长度都与蛋白质中氨基酸残基的差别数成比例。例如人与黑猩猩的细胞色素c的氨基酸序列完全一样,但与猴、狗、金枪鱼和酵母的细胞色素c相比,可变换的氨基酸残基数依次为1、10、21和44。那些进化中不易改变的、保守的氨基酸残基是维持细胞色素c功能所必需的。由同一个祖先进化来的表现出序列相似性的蛋白质称之同源蛋白质。,要点提示1.蛋白质是由20种氨基酸组成的。氨基酸性质方面的差别反映了它们侧链的不同。除了甘氨酸没有手性碳以外,其他19种氨基酸都至少含有一个手性碳。2.氨基酸的侧链可以按照它们的化学结构分为:脂肪族的、芳香族的、含硫的、含醇的、碱性的、酸性的和酰胺类。3.氨基酸和多肽的酸性和碱性基团的离子状态取决于pH。4.许多氨基酸具有非极性的侧链,在水溶液中它们倾向于聚集在一起,以减少与水相互作用的面积,这种倾向称为疏水相互作用。5.茚三酮与脯氨酸反应生成黄色化合物,与其它氨基酸生成的都是紫色化合物。2,4-二硝基氟苯、丹黄酰氯和苯异硫氰酸酯都能与氨基反应。6.蛋白质中的氨基酸残基是通过肽键连接的,残基的序列称之为蛋白质的一级结构。肽和小的蛋白质可以利用液相或固相合成法。7.可以根据蛋白质溶解度、净电荷、大小以及结合特性上的差异,从生物资源中纯化蛋白质。常用方法包括离子交换层析、凝胶过滤层析、HPLC、SDS-PAGE、等电聚焦和双向电泳等方法。8.多肽的氨基酸序列可以通过Edman降解确定。利用蛋白酶和化学试剂有选择地水解,结合Edman降解可确定大的蛋白质的序列。9.比较蛋白质的一级结构可以揭示进化关系,种属的不同常反映在它们蛋白质的一级结构的差异上。,