大肠杆菌基因工程.ppt
《大肠杆菌基因工程.ppt》由会员分享,可在线阅读,更多相关《大肠杆菌基因工程.ppt(147页珍藏版)》请在三一办公上搜索。
1、,基因表达系统,第五章 外源基因的表达,一、大肠杆菌基因工程二、酵母杆菌基因工程三、哺乳动物基因工程四、高等植物基因工程五、外源基因表达产物的分离纯化,一、大肠杆菌基因工程,E.coli作为表达外源基因受体菌的特征外源基因在E.coli中高效表达的原理E.coli基因工程菌的构建策略基因工程菌的遗传不稳定性及其对策利用重组E.coli生产人胰岛素,(一)E.coli作为表达外源基因受体菌的特征,E.coli表达外源基因的优势:,全基因组已测序,共有4,405个开放阅读框架,大部分基因生物学功能已鉴定;,基因克隆表达系统成熟完善;,繁殖迅速、培养简单、操作方便、遗传稳定;,被美国FDA批准为安全
2、的基因工程受体生物。,E.coli表达外源基因的劣势:,缺乏对真核生物蛋白质的翻译后加工修饰系统,如糖基化、磷酸化;,缺乏对真核生物蛋白质的复性功能,表达产物多以无活性的包涵体形式存在;,内源性蛋白酶易降解空间构象不正确的异源蛋白,造成表达产物不稳定;,细胞周质内含有种类繁多的内毒素,痕量内毒素即可导致人体热原反应。,(二)外源基因在E.coli中高效表达的原理,强化蛋白质生物合成抑制蛋白质产物降解恢复蛋白质特异性空间构象,启动子终止子核糖体结合位点密码子质粒拷贝数,强化蛋白质生物合成,1、启动子(promoter,P),启动子:位于结构基因上游,能被RNA聚合酶识别、结合并启动基因转录的一段
3、DNA序列,长40-60bp。,因此,E.coli表达载体所用的启动子必须是E.coli启动子。,没有启动子,基因就不能转录。E.coli的RNA聚合酶不能识别真核基因的启动子。,位于转录起始点上游35bp处,由10bp组成,5-TGACA。,E.coli启动子是由两段彼此分开且又高度保守的核苷酸序列组成:,位于转录起始点上游5-10bp处,由6-8bp组成,5-TATAAT,富含A和T,又称TATA盒。,-10区:,-35区:,-35区与RNA聚合酶s亚基结合-10区与RNA聚合酶的核心酶结合,-10区和-35区的碱基组成及其间隔序列。,启动子和外源基因转录起始点之间的距离。,启动子是控制外
4、源基因转录的重要元件,mRNA生成速率与其强弱密切相关。,-10和-35区与保守序列(5-TATAAT、5-T GACA)相似度越高,启动子活性越强。,-10和-35区的间距越接近17bp,启动子活性越强。,-10区和-35区的碱基组成及其间隔序列:,大多数E.coli启动子与所属基因转录起始点之间的距离是6-9bp,但对外源基因而言,这个距离范围未必最佳。,启动子和外源基因转录起始点之间的距离:,1)启动子最佳距离的探测,目的基因,E,E,A,E,E,启动子,A酶切开,Bal31酶解,目的基因,将目的基因插在一个强启动子下游,若克隆菌内检测不到mRNA,有必要考虑调整启动子与基因之间的距离。
5、,2)启动子的筛选:,探针质粒pKO1的报告基因:半乳糖激酶基因galK,终止子,Ampr,ori,无启动子的galK,pKO13.9 kb,3)启动子的构建:,-35 区序列,-10 区序列,启动子 来 源,PlacPtrpPLPrecAPtac,T T T A C AT T G A C AT T G A C AT T G A T AT T G A C A,T A T A A TT T A A C TG A T A C TT A T A A TT A T A A T,Ptac=3 Ptrp=11 Plac 双Plac串联=2.4 Plac,乳糖操作子色氨酸操作子噬菌体早期操作子recA基因P
6、trp-35区+Plac-10区,4)启动子的可控性:,外源基因的全程高效表达,会对E.coli的生理生化过程造成不利影响。,外源基因持续高效表达的重组质粒,在细胞若干次分裂后,会部分甚至全部丢失,导致重组菌不稳定。,措施:,利用可控性启动子,调整外源基因的表达时序,通过启动子活性的定时诱导,将外源基因的转录启动限制在受体细胞生长的某一特定阶段。,目前广泛应用的E.coli可控性启动子来自相应的操纵子,都含有与阻遏蛋白特异性结合的操纵子序列,其介导的外源基因在E.coli中通常以极低的基底水平表达。,乳糖启动子Plac的可控性:,色氨酸启动子Ptrp的可控性:,噬菌体启动子PL的可控性:,在大
7、型发酵罐中迅速升温困难,常使用双质粒控制系统,间接控制目的基因表达。,应是诱导型的,可通过简单方式、使用廉价诱导物诱导,如温度诱导、IPTG诱导。,最佳启动子必须具备条件:,必须是强启动子,能使外源基因表达量达细胞总蛋白的10-30%以上;,应呈现低水平的基础转录;,2、终止子(terminator,T),强化转录终止的必要性:,过长转录物的产生会影响外源基因的表达。,外源基因在强启动子控制下表达,易发生转录过头现象,RNA聚合酶滑过终止子,继续转录邻近序列,形成长短不一的mRNA混合物。,过长转录产物影响外源基因表达的原因:,1)转录产物越长,RNA聚合酶转录一分子mRNA所需的时间就相应增
8、加,外源基因转录效率下降。,2)若外源基因下游紧接载体的重要功能基因,则RNA聚合酶在此处的转录,可能干扰其生物功能,甚至导致其不稳定性。,4)过长的mRNA往往不能形成理想的二级结构,大大降低翻译效率。,3)过长的mRNA往往产生大量无用的蛋白质,增加工程菌无谓的能量消耗。,pCP1,Ampr,ori,Tcr,筛选Ampr、Tcs的转化子,也可通过探针质粒筛选,唯一的克隆位点处于启动子和报告基因的翻译起始密码子之间,当终止子插入该位点时,由启动子介导的报告基因转录被封闭,从而减少或阻断报告基因的表达。,P,T,强终止子的选择与使用:,对终止作用较弱的终止子,可采用二聚体终止子串联的特殊结构,
9、以增强转录终止作用。,常用终止子来自E.coli rRNA操纵子上的rrn T1T2、T7噬菌体DNA上的T。,E.coli偏爱使用终止密码子UAA,当其后连上一个U而形成四联核苷酸时,转译终止效率会得到进一步加强。,3、核糖体结合位点,外源基因在E.coli中的高效表达不仅取决于转录启动的频率,还与mRNA的翻译起始效率密切相关。,结构不同的mRNA分子具有不同的翻译效率,差别高达数百倍。,mRNA的翻译起始效率主要由其5端的结构序列决定,即核糖体结合位点(ribosomal binding site,RBS)。,1)SD序列:,E.coli RBS的结构:,识别核糖体小亚基中16S rRN
10、A 3端区域3-AUUCCUCC-5,并与之专一性结合,将mRNA定位于核糖体上,启动翻译。,位于翻译起始密码子上游的6-8个核苷酸序列:5-UAAGGAGG-3。,2)翻译起始密码子:,E.coli绝大部分基因以AUG作为翻译起始密码子,但有些基因也使用GUG或UUG作为翻译起始密码子。,RBS对外源基因表达的影响:,1、SD序列的影响:,mRNA与核糖体结合越强,翻译起始效率越高,结合程度取决于SD序列(5-UAAGGAGG-3)与16S rRNA的碱基互补性。以GGAG尤为重要,4个碱基中任何1个换成C或T,均会导致翻译效率大幅度下降。,2、翻译起始密码子的影响:,E.coli起始tRN
11、A可同时识别AUG、GUG和UUG三种起始密码子,但识别频率不同:GUG为AUG的50%、UUG为AUG的25%。,3、SD序列与起始密码子之间距离的影响:,SD序列与起始密码子之间的精确距离保证mRNA在核糖体上定位后,AUG正好处于P位,这是翻译启动的前提。,通常SD序列位于AUG前约7bp处,在此间隔中少1个或多1个碱基,均导致翻译起始效率不同程度的降低。,4、SD序列与起始密码子之间序列的影响:,SD序列下游碱基为AAAA或UUUU时,翻译效率最高;为CCCC或GGGG时,翻译效率是最高值的50%和25%。,如:-半乳糖苷酶mRNA,在此位置上的最佳碱基是UAU或CUU,如用UUC、U
12、CA或AGG取代之,酶的表达水平下降20倍。,紧邻AUG的前3个碱基也会影响翻译起始效率。,5、起始密码子后续若干密码子的影响:,从AUG开始的前几个密码子的碱基序列也至关重要,这一序列不能与mRNA的5端非编码区形成茎环结构,否则会严重干扰mRNA在核糖体上的准确定位。,目前广泛使用的E.coli表达型质粒均含有与启动子来源相同的RBS,序列和间隔是最佳的。,4、密码子,生物体对密码子的偏爱性:,不同生物、甚至同种生物不同的蛋白质编码基因,对简并密码子的使用频率不同,具有一定的偏爱性。,生物体对密码子偏爱性的决定因素:,生物基因组中的碱基含量;,密码子与反密码子相互作用的自由能;,细胞内tR
13、NA的含量。,1、生物基因组中的碱基含量:,在富含AT的生物(如单链DNA噬菌体X174)基因组中,密码子第3位上U和A出现频率较高。,在GC丰富的生物(如链霉菌)基因组中,第3位上含G或C的简并密码子占90%以上。,2、密码子与反密码子相互作用的自由能:,适中的作用强度有利于蛋白质生物合成的迅速进行。,弱配对作用可能使氨酰基tRNA进入核糖体A位需要花费更多的时间。,强配对作用则可能使转肽后核糖体在P位逐出空载tRNA分子耗费更多的时间。,如:,GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少。,GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;,
14、3、细胞内tRNA的含量,简并密码子使用频率与相应tRNA的丰度呈正相关。,表达量高的基因含有较少种类的密码子,这些密码子又对应于高丰度的tRNA分子,以便细胞能以更快的速度合成需求量大的蛋白质。,密码子偏爱性对外源基因表达的影响:,原核生物和真核生物基因组中密码子的使用频率有较大差异,因此哺乳动物基因在E.coli中高效翻译的一个重要因素是密码子的正确选择。,使外源基因上的密码子在E.coli中获得最佳表达的策略:,1、外源基因全合成,按E.coli密码子的偏爱性规律,更换外源基因中不适宜的简并密码子。,如:重组人胰岛素、干扰素、生长激素在E.coli中的高效表达均采用了这种方法。,可将这两
15、个tRNA编码基因克隆在另一高效表达质粒上,构建双质粒表达系统。,2、同步表达相关tRNA编码基因,如:人尿激酶原基因的412个密码子中,有22个Arg密码子,其中7个AGG、2个AGA,而E.coli中tRNAAGG和tRNAAGA丰度较低。,5、质粒拷贝数,质粒拷贝数对细菌生长代谢的影响:,表达型质粒在每个E.coli细胞中达数百甚至上千个拷贝,质粒的扩增过程常发生在受体细胞对数生长期,而此时正是细菌生理代谢最旺盛的阶段。,质粒的过度增殖、目的基因的高效表达会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性、目的基因表达水平下降。,措施:将重组质粒的扩增纳入可控制的轨道。,质粒扩增时序的
16、控制:,pCP3拥有温度可诱导的复制子。,28时,每个细胞的质粒拷贝数为60;,42时,拷贝数迅速增至300-600,受体细胞表达的温度敏感型阻遏蛋白CI857失活,外源基因表达。,用温度可同时控制质粒拷贝数和外源基因表达。,(三)大肠杆菌基因工程菌的构建策略,包涵体型表达分泌型表达融合型表达寡聚型表达整合型表达蛋白酶抗性或缺陷型表达系统的构建,1、包涵体型表达,E.coli表达的蛋白质在细胞内凝集,形成无活性、不溶于水的固体颗粒,称为包涵体(Inclusion Bodies,IB)。,包涵体的性质:,大部分存在细胞质中,基本上由蛋白质组成。,少量DNA、RNA、脂多糖等非蛋白分子。,E.co
17、li本身表达的蛋白(如RNA聚合酶、外膜蛋白)、载体蛋白(如标记基因表达产物)。,50%以上是外源基因表达产物,氨基酸序列正确,但空间构象往往错误,无生物活性。,包涵体表达形式的优点:,1、简化表达产物的分离操作,包涵体不溶于水、密度远大于细胞碎片和其它细胞成分,菌体经超声波裂解后,通过高速离心,即可分离出来。,2、保持表达产物的结构稳定,形成包涵体后,E.coli的蛋白酶降解作用对外源蛋白的稳定性构不成威胁。,包涵体表达形式的缺点:,表达的目的蛋白无生物学活性,必须通过有效的变性、复性,才能获得正确空间构象。,变/复性效率对目标产物的收率至关重要,也是一技术难题。尤其目的蛋白分子中Cys残基
18、较多时,复性成功率相当低,一般不超过30%。,外源基因在E.coli中的表达量占细胞总蛋白20%以上时,表达产物倾向形成包涵体。,以包涵体形式表达目的基因,关键是选择高效表达载体,高表达率也是包涵体法的优势所在。,包涵体的变性与复性操作,蛋白质变性复性的动力学原理:,共价修饰和集聚状态的蛋白质不能进入复性过程,成为无活性的蛋白质。包涵体中的蛋白质即属于这两种状态,需在体外进行变性(解除共价修饰和驱散集聚体)、复性操作。,包涵体的变性溶解:,用强变性剂如尿素、盐酸胍,通过离子间相互作用,打断包涵体蛋白质分子内和分子间的各种化学键,使多肽伸展。,便宜,但溶解能力弱、且尿素分解的异氰酸盐能导致多肽链
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大肠杆菌 基因工程
链接地址:https://www.31ppt.com/p-5956161.html