克隆基因在真核生物中的表达.ppt
第十一章 克隆基因在真核生物中的表达,真核表达系统是指利用真核生物细胞作为外源基因表达宿主的一类基因表达系统,常用的真核系统包括酵母、丝状真菌、昆虫类、植物和哺乳动物细胞等表达系统。本章主要是关于酵母表达系统。,目前,EColi 等原核表达系统以其易于操作、遗传背景清楚、发酵成本低和蛋白表达水平高等优点,依然是生产重组蛋白的首选外源基因表达系统。但是我们为什么要发展真核表达系统呢?,第一节 真核表达系统的发展,使克隆基因在细胞中表达对理论的研究以及实验的应用都具有十分重要意义的。克隆的基因只有通过表达才能探索和研究基因的功能以及基因表达调控的机理,克隆基因表达出所编码的蛋白质可供作结构与功能的研究。有些具有特定生物活性的蛋白质在医学上、以至在工业上都是很有应用价值的,可以通过克隆其基因使之在宿主细胞中大量表达而获得。,第一节,要使克隆基因在宿主细胞中表达,就要将它放入带有基因表达所需要的各种元件的载体中,这种载体就称为表达载体(expression vector)。克隆基因可以放在不同的宿主细胞中表达,可以利用大肠杆菌、枯草杆菌、酵母、丝状真菌、昆虫细胞、培养的哺乳类动物细胞、以至整体动物作为表达宿主。对不同的表达系统,需要构建不同的表达载体。克隆基因在不同的系统中表达成功的把握性,取决于我们对这些系统中宿主基因表达调控规律的认识程度。,人类对大肠杆菌经过长期的研究,对其特性和遗传背景了解得最清楚,大肠杆菌培养操作简单、生长繁殖快、价格低廉,人们用大肠杆菌用外源基因的表达工具已有二十多年的经验积累,大肠杆菌表达外源基因产物的水平远高于其它基因表达系统,表达的目的蛋白量甚至能超过细菌总蛋白量的80%。因此大肠杆菌是目前应用最广泛的蛋白质表达系统。,真核基因在大肠杆菌中表达体系的不足:1.真核基因,在结构上同原核基因之间存在着很大的差别。2.真核基因的转录信号同原核的不同。细菌的RNA聚合酶不能识别真核的启动子;外源基因可能含有具大肠杆菌转录终止信号功能的核苷酸序列。3.真核基因mRNA的分子结构同细菌的有所差异,影响真核基因mRNA稳定性。4.许多真核基因的蛋白质产物,都要经过转译后的加工修饰(正确折叠和组装),而大多数的这类修饰作用在细菌细胞中并不存在;5.细菌的蛋白酶,能够识别外来的真核基因所表达的蛋白质分子,并把它们降解掉。,真核基因放入原核细胞中表达产生蛋白质时的不足没有真核转录后加工的功能,不能进行mRNA的剪接,所以只能表达cDNA而不能表达真核的基因组基因。没有真核翻译后加工的功能,表达产生的蛋白质,不能进行糖基化、磷酸化等修饰,难以形成正确的二硫键配对和空间构像折叠,因而产生的蛋白质常没有足够的生物学活性。表达的蛋白质经常是不溶的,容易在细菌内聚集成包涵体(inclusiion body)。,什么是包含体?,包涵体是指细菌表达的蛋白在细胞内凝集,形成无活性的固体颗粒。包涵体的组成与特性:一般含有50%以上的重组蛋白,其余为核糖体元件、RNA聚合酶、外膜蛋白OMPC等,还夹杂有环状或缺口的质粒DNA,以及脂体、脂多糖等,大小为0.5-1um,难溶与水,只 溶于变性剂如尿素(脲)、盐酸。,大肠杆菌包含体的形成,原核生物中当表达目的蛋白量超过细菌体总蛋白量10%时,就很容易形成包涵体。包涵体是无生物活性的不溶性蛋白,要经过复性(renaturation),使其重新散开、重新折叠成具有天然蛋白构象和良好生物活性的蛋白质,常常是一件很困难的事情,也是蛋白质产业化的瓶颈。也可以设计载体使大肠杆菌分泌表达出可溶性目的蛋白,但表达量往往不高。,可见尽管原核生物(大肠杆菌)表达系统有众多的优点,但并非每一种基因都能在其中有效表达,也没有一种表达系统能对所有的基因进行表达。真核基因表达调控复杂性的,远超出我们的了解,因此发展多种真核表达系统在理论研究核实际应用都具有非常重要的意义。,发展真核表达系统的必要性及其优势1.具转录后加工系统2.具翻译后修饰系统3.可实现真正的分泌表达4.真核生物的基因工程5.基因治疗,自从1979年开始,科学家为了克服大肠杆菌表达系统表达真核基因的缺点,开始利用酵母来作为表达系统。由于酿酒酵母与人的生活和生产密切相关,没有致病性,具有和大肠杆菌一样容易的培养方式,又具有真核生物翻译后的修饰功能,所以成为首选的表达宿主。,Recombinant Human Interferon,1981年首先将人的a-干扰素基因实现在酵母中成功表达。,第二节 真核基因的表达与调控 真核基因的表达与调控是一个多水平(包括转录前、转录、转录后、翻译、翻译后)的复杂调控过程。,(一)真核生物基因的表达调控的特点1.DNA量大,不存在操纵子结构,2.真核细胞的编码基因大多是不连续的,由外显子和内含子镶嵌排列而成。外显子(exon):为蛋白质氨基酸编码的DNA序列。内含子(intron):插入到编码序列之间的非编码序列。内含子功能:含调控序列,参与基因表达。提供变异机会,与进化有关。,真核的mRNA单顺反子,多内含子。寿命比原核mRNA的长。内含子(intron):也称内元,在原初转录物中,通过RNA拼接反应而被去除的RNA序列,或基因中与这种序列对应的DNA序列。外显子(exon):也称外元原初转录物通过RNA拼接反应后,而保留于成熟RNA中的序列,或基因中与成熟RNA对应的DNA序列。,TATA盒,翻译起始植物C/GAANNATGG动物A/GNNATGG,各内含子,加poly(A)信号植物 G/AATAA1-3动物 AATAAA,终止密码子,各个外显子,AGGA或 CAAT盒,加帽位点 5m7GpppNp,5端,真核基因的一般结构,真核生物基因表达过程示意图,真核生物结构基因示意图,真核生物基因的结构特点,可见,真核生物基因的转录和翻译具有时间和空间上的分隔。上述真核生物基因转录后的剪切、拼接和转移等过程,都需要有调控序列的调控,这种调控作用是原核生物所没有的。,(二)转录前表达调控 发生在基因组水平上的基因结构的改变。包括基因丢失、基因扩增、基因重排、甲基化修饰及染色质结构影响。,(三)转录水平的调控 主要涉及3种因素的相互作用。1.RNA聚合酶 2.顺式调控元件 3.反式作用因子,1.RNA聚合酶(RNA polyperase,RNA pol)真核生物RNA pol有3种:、。RNA pol:存在于核仁,转录产物为 rRNA(5.8s、18s、28s)。RNA pol:存在于核质,转录产物为 mRNA及其他一些功能不明的 小分子量RNA。RNA pol:存在于核质,转录产物为 tRNA和5sRNA。,与真核生物不同的是原核生物一种RNA聚合酶,合成各种RNA(mRNA、tRNA、rRNA)。一个E.coli细胞中约有7000个RNA聚合酶分子,在任一时刻,大部分聚合酶(5000左右)正在参与RNA的合成。,E.coli RNA聚合酶全酶(holoenzyme)分子量46万Da,由六个亚基组成,2,另有两个Zn2+。无亚基的酶叫核心酶,核心酶只能使已开始合成的RNA链延长,而不具备起始合成活性,加入亚基后,全酶才具有起始合成RNA的能力,因此,亚基称为起始因子。,不同的原核生物,、亚基分子量变化不大,亚基分子量变化较大,44KD92KD。不同的因子识别不同的启动子,从而表达不同的基因。不同的原核生物,都具有相同的核心酶,但亚基有所差别,这决定了原核基因表达的选择性。,真核基因和原核基因RNA聚合酶的差异说明了什么呢?这说明了一个问题,真核基因和原核基因的启动子有很大的差异,两者是不能互用,特别是原核生物的启动子很难被真核生物的转录系统识别。而真核基因的表达的时空调控性更加说明真核表达系统启动子的使用更为严格。,2.顺式调控元件 顺式调控元件(cis-acting element,CAE):与结构基因串联的特定的DNA系列。(1)启动子(promoter):与基因转录启动有 关的核心序列。,真核启动子真核基因的转录十分复杂,对启动子的分析要比原核基因的困难得多。真核生物有三种RNA聚合酶:RNA聚合酶I、II、III,分别转录rRNA、mRNA、tRNA和小分子RNA,这三类聚合酶的启动子各有其结构特点。,真核生物启动子分为3类,分别结合3种不同的RNA pol,这其中也需要3种不同的转录因子,即TF、TF 和 TF。,Goldberg-Hogness盒(Hogness盒,TATA盒):核心序列为TATAATAAT,位于转录起始位点-30bp区域。TATA盒主要通过与TATA盒结合蛋白(TATA box binding protein,TBP)以及TBP相关因子(TBP associated factor,TAF)的相互作用而发挥功能。其功能有3:决定了转录的精确起始;介导转录 起始复合物的形成;在某些启动子中决定转录 的方向。,TATA框(Hogness框)中心在-25至-30,长度7bp左右。碱基频率:T82 A97 A85 A63(T37)A83 A50(T37)(全为A-T,少数含有一个G-C对)。此序列功能:使DNA双链解开,并决定转录的起点位置,失去TATA框,转录将可能在许多位点上开始。TATA框的改变或缺失,直接影响DNA与酶的结合程度,会使转录起始点偏移,因此,TATA是绝大多数真核基因正确表达所必需的。,由于RNA聚合酶分子有相对固定的空间结构,同此框的结合位点和转录反应催化位点的距离,决定了起始位点的正确选择。启动子特定序列和酶的正确结构,这两者把酶置于一种正确的构象中,决定了识别的正确性和转录起始的正确性。,上游启动子元件(upstream promoter element,URS):包括CAAT盒和GC盒,位于转录起始位点中心在-75处,9bp,共有序列GGT(G)CAATCT功能:与RNA聚合酶结合。与TATA盒协同作用,决定了基因的基础转录效率。GC框在CAAT框上游,序列GGGCGG,与某些转录因子结合。CAAT和GC框均为上游序列,对转录的起始频率有较大影响。,(2)增强子(enhancer):位于-200-300bp区域,由多个独立的、具有回文结构的核苷酸组成,以单拷贝或多拷贝的形式存在。促进基因转录活性。无方向性。远距离作用。无基因特异性。具有组织特异性。具有相位性。,(3)沉寂子(silencer)和衰减子(dehancer):抑制基因转录。(4)加尾信号:在poly A尾位点上游10-20bp处,常见1保守的AATAA序列,如去除此序列,基因会连续转录下去而不终止。,polyA的功能:a.防止核酸外切酶对mRNA信息序列的降解,起缓冲作用。b.与mRNA从细胞核转移到细胞质有关。,3.反式作用因子 反式作用因子(trans-acting factor,TAF):由位于不同染色体或同一染色体上相距较远的基因编码的蛋白质因子。CAE是TAF的结合位点。由于TAF结构上含有1个与DNA结合的结构域,能与特定的DNA序列结合,因此TAF也被称为DNA结合蛋白(DNA binding protien,DBP)。,根据TAF的作用方式,TAF可分为3类。(1)普通转录因子:多数细胞中普遍存在的一类转录因子。如TATA盒结合因子TFD、GC盒结合因子SP1等。(2)组织特异性转录因子:基因表达的特异性很大程度上取决于组织特异性转录因子。(3)诱导式反式作用因子:其活性可被特异的诱导因子所诱导。如cAMP结合转录因子、热休克转录因子、类固醇受体等。,(四)转录后水平的调控,1.戴“帽”(capping)5加上m7GpppN。防止降解,延长寿命。与核糖体小亚基结合。为翻译起始因子所识别。,2.加“尾”(tailing),3加poly A。为mRNA进入细胞质所必须。保持mRNA稳定性。PABP:poly A结合蛋白(poly A binding protein)。,3.拼接(splicing),拼接(splicing):将hnRNA(核不均一RNA)中的内含子序列切除,外显子部分连接起来,称为RNA拼接。,(五)翻译水平的调控,1.对可溶性蛋白因子的修饰 如eIF-2磷酸化后,可抑制蛋白质的合成。2.对mRNA稳定性调节 如催乳激素可使乳腺组织中的酪蛋白的半衰期提高20倍。,3.反义RNA对翻译的调节 反义RNA(anti-sense):一段含有与被调控基因所产生mRNA互补的碱基序列的小分子RNA。与mRNA结合,形成双链RNA。影响mRNA的模板效率;可能参与mRNA的拼接。,(六)翻译后水平的调控1.切割:分泌型蛋白必须切除疏水性信号肽。酶原酶。2.化学修饰 磷酸化;糖基化;乙酰化。3.连接 有些蛋白经切割成小肽后,还必须以一定的方式连接起来。,原核与真核生物在其生物遗传特性上有着显著的差别:前者由于形态相对简单,基因库存储空间有限而追求简洁高效,但同时以牺牲系统稳定性为代价;后者以更复杂系统的协调运作方式出现,自然要求较高的系统稳定性,这又必然导致基因库的冗余增多及表达的时空效率下降。,由此可见真核基因的表达进行调控远比原核生物要复杂的多,虽然目前科学家已经开发出多种真核表达系统,但是由于对作为表达真核基因的宿主的了解不是十分清楚,很多基因的在真核生物中的表达还处于“黑箱”的过程,还不能随意地控制基因的表达。,要使外源基因在真核细胞里的表达更容易地被人们控制,需要对宿主基因表达调控的机理做更多的了解。目前多数外源基因真核表达系统所采用的启动子,是利用在宿主内一些容易被控制的基因的启动子,尽量不用复杂调控系统的基因的启动子。,第三节 真核表达系统表达载体的组成,外源基因真核表达系统的表达载体在原理上与原核表达载体的结构是相似的,但是由于真核生物也存在很大的差异,在启动子等调控元件上会有一定的差别。,真核细胞表达体系表达外源基因具有下列特点:1)由于真核细胞内具有一系列剪切酶,外源基因的内含子可被自动剪除,并成功表达目的多肽。它不像原核细胞表达体系那样必须从mRNA制备cDNA;2)真核基因在真核细胞中表达时,其S-D序列与细胞核糖体RNA(rRNA)16S亚基3末端的互补程度较高,对翻译水平的调节有利;,3)在真核细胞内,由外源基因表达的蛋白可被糖基化,成为糖蛋白,有利于保持或提高免疫原性;4)外源基因导入真核细胞的效率较低,其在染色体DNA上的整合是随机的和自发的,目前还无法控制整合的位置和适当的拷贝数;5)真核细胞的培养要求较高,大量生产比较困难,成本也高。,哺乳动物细胞(如CHO细胞)表达外源蛋白的最大优点是正确的高级结构(如糖基化),非常适用于表达药物蛋白。培养技术包括贴壁(有载体)灌流表达、悬浮灌流表达。采用特殊的细胞悬浮驯化技术,得到高表达的悬浮株;培养、表达过程中通过优化营养成分、控制参数、抑制凋亡等手段使细胞得到长时间高效表达。采用贴壁技术表达外源蛋白水平一般能达到300-2000 mg/L;采用悬浮技术表达外源蛋白水平一般能达到100-1000 mg/L。,糖基化代谢工程对于重组蛋白生产和寻找新型药用糖蛋白有潜在的意义。在选择哺乳动物细胞进行生物技术药物生产时,必须对细胞蛋白的糖基化形式加以考虑。糖链影响糖蛋白的药理活性,生理生化特性(溶解性、稳定性、折叠和分泌)及药代动力学(半衰期、靶向性、免疫原性和抗原性)。如高甘露糖存在或碳水化合物末端唾液酸化缺乏时其血浆清除快。,真核表达载体至少要含两类序列:原核质粒的序列,包括在大肠杆菌中起作用的复制起始序列、能用在细菌中筛选克隆的抗药性基因标志等,以便插入真核基因后能先在很方便操作的大肠杆菌系统中筛选获得目的重组DNA克隆、并复制繁殖得到足够使用的数量。在真核宿主细胞中表达重组基因所需要的元件,包括启动子、增强子、转录终止和加poly-A信号序列、mRNA剪接信号序列、能在宿主细胞中复制或增殖的序列,能用在宿主细胞中筛选的标志基因、以及供外源基因插入的单一限制性内切酶识别位点等。,酵母是最主要的真核外源基因表达系统,因此本章的主要内容关于酵母表达系统的结构及应用策略。,第四节 酵母表达系统,酵母菌是单细胞真核生物,具有生长快、易于遗传操作、能对外源蛋白进行翻译后加工和修饰、不产生有毒产物等特点,被认为是表达外源蛋白的合适宿主。作为一种真核生物,它具有完成的亚细胞结构和控制严密的基因表达调控机制。,一、酵母表达系统的发展概况,1974年发现在大多数酿酒酵母存在者一种2u质粒,这种质粒全称6.3kb,在二倍体的细胞中存在60100个拷贝。到1978年建立了酿酒酵母的LEU2营养缺陷型筛选标记,这标志者酵母表达系统的成功建立。到1981年成功表达人的a干扰素,成为第一个成功表达外源基因的真核表达系统。1996完成了酿酒酵母的全基因组测序,更为人类深入研究酵母打下良好的基础。,ARS:独立自主复制序列STP:与质粒分配到子细胞有关FLP:与质粒的拷贝数有关,由REP1、REP1和D基因控制其表达,酵母作为表达系统的优势酵母具有真核生物的特征,遗传背景清楚、稳定,生长迅速,培养简单,外源基因表达系统完善。酵母是一类种类繁多的生物资源,已知有80多个属约600多个种,数千个分离株。有些酵母如酿酒酵母(Saccharomyces cerevisiae)克鲁(Kluyveromyces lactis)已经被人类用于食品生产有几十年甚至上千年的历史。,酵母细胞能够分泌表达多种蛋白质。总的来说,那些能够被天然宿主分泌表达的蛋白质(如糖苷酶,血清白蛋白,细胞因子等)易于分泌表达。然而,众多参考文献中的实验证明:不同类型的酵母细胞也能分泌表达许多非分泌性蛋白质。因此,当不确定某种蛋白质的表达方式时,最好尝试分泌表达。此外,酵母中胞内表达适用于多种蛋白质,它也是细菌蛋白质表达的主要替代方式。,高水平表达重组蛋白质快速高密度细胞生长大肠杆菌克隆中无背景基因表达方便、快捷的细胞转化步骤无需昂贵的抗生素但是,不是所有的酵母都适合做表达宿主的,酵母作为外源蛋白表达宿主的优点:,作为基因表达的宿主需要具备的条件:安全无致病性有较清楚的遗传背景,容易进行分子操作容易进行载体的导入培养条件简单,容易进行高密度培养有良好的蛋白质分泌能力有类似高等真核的翻译后修饰功能,二、酵母表达载体的基本结构,由于大肠杆菌的的转化简单、高效,质粒的制备方便,因此酵母的表达载体为了操作上的简单,一般都是构建成带有大肠杆菌质粒基本骨架的酵母大肠杆菌穿梭载体。,酵母表达载体的构件:DNA复制起始区选择标记整合介导区有丝分裂稳定区表达盒,(一)DNA复制起始区 这是一段具有功能的DNA复制起始的DNA序列。这种序列通常来自酵母的2u质粒的复制起始位点或酵母基因组中的自主复制序列(autonomously replication sequence,ARS)。DNA复制起始区能使载体在细胞具有复制并分配到子代细胞的能力。整合型载体中不需要DNA复制起始区,单在非整合型载体中是必不可少的。,(二)选择标记 选择标记是载体转化酵母时筛选转化子所必须的元件,它们能和宿主的基因型配合,或者能使宿主产生新的表型,从而筛选出重组子。,酵母表达系统具有两种筛选标记有两类:a.营养缺陷型筛选标记,如leu2、ura3、his3、lys2等。b.显性筛选标记,如G418、CYH、ARS等。显性筛选标记的优点是它可以用于野生型酵母菌株的转化,可以用于多倍体酵母。,(三)整合介导区这是以宿主基因组序列高度同源的一段DNA序列,它可以介导载体盒宿主染色体之间发生同源重组,使载体整合到染色体上。理论上染色体的任何序列都可以作为整合介导区。但是方便使用是营养缺陷型的选择标记。如果需要获得多拷贝的重组菌可以采用基因组的重复序列(如rDNA、Ty序列)。,(四)有丝分裂区有丝分裂区的作用就是当细胞有丝分裂时能帮助载体在母细胞和子细胞之间平均分配,是决定转化子稳定性的重要因素。常用的有丝分裂区是来自酵母的着丝粒片断,此外来自酿酒酵母的2u质粒的STB片断也是有助于提高游离载体的稳定性的。,(五)表达盒表达盒是酵母表达载体最重要的元件,它主要由启动子和转录终止子组成,如果是要构建分泌载体还需要有信号肽序列。,a.启动子 启动子是酵母表达载体的核心构件,一般为12 kb,不同的酵母会采用不同的启动子,也有组成型启动子等。,一般来说外源基因在酵母中的表达与启动子密切相关,所以筛选高效的启动子来表达外源基因就显得更为重要了。常用的酵母启动子:与糖代谢相关的启动子,GAP、PGK与醇代谢相关的启动子,AOX,糖代谢相关的启动子,如ADHI、PGK、GAP、ENOI等,这些启动子在早期被看作是组成性的,能在酵母菌中高水乎组成性表达,可用于克隆哺乳动物基因,但后来发现能被葡萄糖诱导,例如用PGK启动子表达a干扰素时,在醋酸盐作碳源的培养基中加葡萄糖可诱导 2030倍。这类启动子已广泛应用于实验室,也有用于工业的。第二类是强调节启动子,其中GAL1、GAL7和GAL10是半乳糖调节启动子,已用作真核生物转录调节的关建模式系统。,b.Kozak序列 Kozak序列是位于起始密码子前面的核糖体结合位点,作用相当于原核生物的RBS序列,在酿酒酵母中Kozak序列一般是AAAAAA(ATG),c.转录终止子和加poly-A信号序列 终止子决定mRNA 3末端的形成效率,在酵母中和高等真核生物相似也需要进行前体mRNA的加工和加poly-A尾巴的修饰,但是在酵母中这些反应中是紧密偶联的,而且是发生在mRNA 3末端的附近。所以一般酵母的终止子一般500bp左右。,d.分泌信号肽分泌信号肽的作用是引导分泌蛋白沿着正确的途径转移到细胞外,这对于分泌蛋白的翻译后加工和生物活性都是具有重要意义的。酵母一般能一定程度上识别外源基因的信号肽,但是分泌效率很低,a因子信号肽是酵母中最常用的信号肽。,以上这些构件可以构成不同表达载体,但在不同的酵母中这些构件的来源也不同。在酵母的基因表达中发挥重要的作用。,(六)酵母的DNA转化系统,DNA转化系统是表达系统构建的必要先决条件,由于酵母具有复杂的细胞壁结构,最早用于酵母转化的方法是原生质体法。目前酵母的DNA转化方法还有有电穿孔法和离子法。,原生质体法利用蜗牛酶和纤维素酶等降解酵母的细胞壁,保留完整的细胞膜后就能够吸收外源的DNA。原生质体转化法适合很多的酵母,但是控制酵母细胞原生质体的称度比较困难,不容易掌握和重复。费时、费钱。,电穿孔法电穿孔法是利用脉冲电场改变细胞膜的状态和通透性,达到将DNA导入细胞。将待转化的质粒或DNA重组连接液加在电穿孔转化仪的样品池中,两极施加高压电场,在强大电场的作用下,细菌细胞壁和细胞膜产生缝隙,质粒或DNA重组分子便可进入细胞内电穿孔转化法操作简单,而且几乎对所有含细胞壁结构的受体细胞均有效,但转化效率差别很大。以同样的原理,电穿孔法也可用于质粒消除,离子法一价阳离子Cs、Li能增加酵母细胞对外源DNA的吸收,虽然转化效率没有原生质体转化法效率高,但是对于附加型质粒在一些酵母,如附加型质粒在酿酒酵母中利用LiCl转化可以达到103,对于一般的应用来说已经够用。使用静止期的酵母细胞的转化,方法简单,但是不是所有的酵母都是适合的,不同酵母转化率差异很大,线性DNA转化效率会降低。,三、酵母表达载体的种类,不同的酵母存在不同的载体,它们在基本结构上有很大的相似点,但是使用的目的不同,使用的载体不同。,酵母整合型载体(YIp)这类载体只含 E.coli的复制起点,不能在酵母菌中自律复制,而是通过同源重组,以低频率整合到细胞染色体中。整合位点数取决于载体中的互补基因组序列数。它在基因组内通常以单拷贝存在,但也可能发生多位点整合。如果在YIp内插人一个不完全基因,则可用以创造基因破坏或突变。大部分YIp质粒含酵母菌选择标记(如 HIS3、LEUZ、TRPI及 URA3等)这种质粒的转化子很稳定,可在无选择条件下培养很多代而不丢失,但其转化频率很低(110ugDNA),使YIp线性化可明显增加转化100倍以上。,Yip载体的结构,醇母茵附加型质粒栽体(YEp)这类质粒载体以酵母菌内源2um质粒为基础。2um质粒是一种小分子双链环状DNA,存在于酵母属的大多数菌株中,每个细胞内有50100拷贝。它由2个各599巾的反相重复分隔成2个区域,含有4个可读框(ORF)和一个复制起点。其中REPI和REP2编码的产物与细胞分裂时的质粒平均分配有关,所有YEp载体都含2um质粒的REP3位点,它是保证质粒稳定性必要的因子;此外还含2um质粒的ori、选择标记和细菌有关DNA序列YEP载体的稳定性比较好,是酵母遗传工程中应用最广泛的载体系统,常用于酵母茵中的一般克隆和基因表达研究。,酵母菌复制载体(YRP)YRP即含有酵母独立自主复制序列(ARS),因而可作为染色体外因子复制并保留下来。这种序列来自酵母菌的基因组,当然也可能来自其它生物。这种载体转化酵母的频率很高,可达103105/ug DNA,且在细胞群体内拷贝数很高,但由于减数分裂和有丝分裂时的不稳定而使群体内的拷贝数变化很大,平均拷贝数为 110细胞。上述现象是由于细胞分裂时质粒的不对称分离造成的YRP可用作一般克隆目的,但因其不稳定性和不对称分离而不适于基因调节机制的研究和应用。,酵母菌着丝粒载体(YCp)该载体除含复制起点外,还含有酵母菌染色体的着丝粒(CEN),因而能在染色体外自我复制。在细胞分裂时新复制的质粒均等分离,每一个子细胞得到l3个质粒,故拷贝数很低,但很稳定。由于YCp的高稳定和低拷贝数,因而适合作亚克隆载体和构建酵母菌基因组DNA文库,可用于检测有丝分裂中染色体倍性变化和分析鉴定酵母茵基因突变。,酵母菌线性载体(YLP)YLP除含自律复制所必需的因子外,还含端粒(TEL)和选择标记。这类载体能在酵母菌中复制和保留下来,因而已被用于一般克隆目的。这些线性质粒可转化井保留在不同属的酵母菌中。,四、外源基因在酵母中表达的基本策略,(1)提高外源基因在酵母中的表达水平(2)提高外源基因表达产物的质量,(1)提高外源基因在酵母中的表达水平外源基因表达水平的高低决定了它是否能成为产品,对于医用蛋白的表达相对要求较低,但对于工业用蛋白的要求较高。,(1)提高外源基因在酵母中的表达水平提高和控制外源基因的转录水平外源基因的表达量和转录水平有很大的关系,所以选择强的启动子就十分重要了。,常用的酵母启动子:与糖代谢相关的启动子:3-磷酸甘油醛脱氢酶基因的启动子(GAP)甘油激酶基因启动子(PGK)酸性磷酸酶基因启动子(POH5)与醇代谢相关的启动子,醇氧化酶基因启动子(AOX,MOX),(1)提高外源基因在酵母中的表达水平b.提高外源基因表达盒在宿主中的拷贝数提高外源基因在宿主的拷贝数对基因的表达水平有明显的影响,一般来说拷贝高的表达量也高。,提高外源基因拷贝的方法?利用酵母天然的内源多拷贝质粒,如酿酒酵母的2um质粒,可以达到60100个拷贝以上。但是这种内源质粒连上外源基因后在非选择性培养基会存在不稳定的想象,有时拷贝数会低于10个以下。,提高外源基因拷贝的方法?利用酵母基因组中的多拷贝重复序列进行整合获得多拷贝。不是所有的酵母都有天然的内源多拷贝质粒,但是所有的酵母都有多拷贝重复序列。如利用rDNA序列作为整合位点可以达到60100个拷贝以上。在非选择性培养基也十分稳定。,在一定的条件下以染色体上的单拷贝的序列作为整合位点介导区,也可以筛选到稳定的多拷贝转化子。如在Pichia酵母中以pPIC9K或pPIC3.5K,在G418的选择压力下以his4或AOX1作为整合介导区可以获得高的拷贝外源基因。,(1)提高外源基因在酵母中的表达水平c.提高外源基因表达的因素外源基因在宿主中的表达是一个综合性的问题,为了提高外源基因在宿主的表达水平还要一下因素需要考虑的,如翻译起始区前后的二级结构;密码子的偏好性,发酵条件的控制等。,在酵母存在AT富含区容易产生一些转录中断的序列,如在巴斯德毕赤酵母TTTTATA和ATTATTTTATAAA序列能使多数起始转录发生转录中断现象。,(2)提高外源基因表达产物的质量,对于利用酵母表达外源基因,特别是表达药用蛋白时我们要求表达的产物在结构上尽可能地和天然的产物保持一样的,这就是表达产物的可靠性问题(authensicity),或是质量问题。特别是现代化的检测手段出现可以检测到很多的差异,这一问题更要考虑。,(2)提高外源基因表达产物的质量,影响外源基因表达产物质量的因素有很多,主要的因素有:外源基因在表达系统中的遗传稳定性;细胞内产物的加工和修饰;分泌表达产物的加工和修饰。,外源基因在表达系统中的遗传稳定性外源基因在表达系统中的突变事件不可避免的会经常发生,如果外源基因是多拷贝的形式进行表达的,这中突变不会对表达产物的质量产生太大的影响。有时由于突变不仅会影响到表达产物的质量,还会使突变的酵母具有生长优势,在高密度发酵中延长发酵会增加突变的频率。,细胞内产物的加工和修饰酵母表达产物的加工和修饰包括:N端的甲硫氨酸残基的去除,氨基端的乙酰化,羧端的甲基化等。酵母还具有比较的强的亚基装配能力,很多人的基因表达产物都可以在酵母中得到正确的加工和修饰,但是酵母很难对人的膜蛋白进行正确的加工和修饰。,分泌表达产物的加工和修饰酵母可以对很多表达蛋白进行分泌表达,分泌表达不仅可以提高水平,还可以简化表达产物的纯化步骤,同时分泌表达也是表达蛋白完成一系列加工和修饰的必须步骤,这对于保证表达产物的天然活性十分重要的。,大多数药用蛋白的天然构象都是糖基化的,虽然酵母的糖基化的识别位点和很多高等真核生物使一样,但是酵母容易形成过长的侧链,即所谓的过糖基化现象。,糖基化代谢工程对于重组蛋白生产和寻找新型药用糖蛋白有潜在的意义。糖链影响糖蛋白的药理活性或引起过敏反应,生理生化特性(溶解性、稳定性、折叠和分泌)及药代动力学(半衰期、靶向性、免疫原性和抗原性)。如高甘露糖存在或碳水化合物末端唾液酸化缺乏时其血浆清除快。,虽然有些酵母突变体可以产生较短的糖基化链,但是这类突变体生长不好,不利于做表达宿主。糖基化还是酵母需要进一步解决的问题。,五、常用的酵母表达系统,酵母作为宿主用于表达高等真核生物重组蛋白表现出很多的优点,有着巨大的发展潜力。丰富的酵母资源使得人们可以开发出多种以酵母为表达宿主的表达系统,不同种类酵母得表达系统在表达调控上存在着一定程度的差异。,1、酿酒酵母(S.cerevisiae)表达系统,酿酒酵母是第一个用于生产重组蛋白的酵母,1981年酿酒酵母表达了第一个外源基因a干扰素基因,随后又有一系列外源基因在该系统得到表达。其中干扰素和胰岛素已大量生产并在人群中广泛应用。,用于酿酒酵母表达系统得的质粒有两类:无ARS序列的YIP型载体YEp型质粒,无ARS序列的YIP型载体YIP型载体整合到染色体上,稳定性高,缺点为拷贝数低,但采取一些措施可以初步解决这个限制问题。第1个策略:用酵母转座子以产生多个插入拷贝;第2个策略:将re-DNA插入到核糖体DNA(rDNA)簇中,在宿主的X染色体上以150串联重复序列存在。用特殊的质粒如pMIRY2转化可产生上百个整合拷贝。整合的pMIRY2在无选择压力下分裂时保持稳定。,YEp型质粒 YEp型质粒,常以30或更多拷贝存在,但不稳定。它能独立于酵母染色体之外复制,为穿梭质粒。为了克服这些载体的不稳定性,以脆弱的srbl-1突变的宿主株为基础建立自然选择系统。这个菌株要求渗透压稳定;否则会裂解,转化后带野生型SRB的自主复制YEp型质粒与此菌株进行互补,可在培养基上保持选择性。,酿酒酵母可以分泌表达外源蛋白,通常为将重组蛋白的成熟蛋白形式与结合信息素的prepro序列融合。Pro序列可用Kex2酶的蛋白水解作用切去,这个步骤是广泛存在于真核生物中的。在分泌中,糖基化能在正确位点发生,但常异于天然蛋白的形成,因为其糖链常过长,或为高甘露糖型,得到的这种蛋白会有免疫性,限制了这种糖蛋白用于人类疾病的治疗。,虽然酿酒酵母成功表达很多基因,但很大部分表达由实验室扩展到工业规模时,培养基中维持质粒高拷贝数的选择压力消失,质粒变得不稳定,拷贝数下降,因此引起产量下降。同时,实验室用培养基复杂而昂贵,采用工业规模能够接受的培养基时,往往导致产量的下降。这些不足促使人们发展了其它酵母表达系统。,2、甲醇酵母(甲基营养型酵母)表达系统,甲基营养型酵母包括:Pichia、Hansenula polymopha、Candida等以Pichia.pastoris(毕赤巴斯德酵母)和Hansenula polymopha为宿主的外源基因表达系统近年来发展最为迅速,应用也最为广泛,已利用此系统表达了一系列有重要生物学活性的蛋自质。,甲基营养型酵母表达系统除了具有一般酵母所具有的特点外,还有以下几个优点:具有醇氧化酶AOX1基因启动子,这是目前最强,调控机理最严格的启动子之一。表达质粒能在基因组的特定位点以单拷贝或多拷贝的形式稳定整合。,菌株易于进行高密度发酵,外源蛋白表达量高。分泌效率强的信号肽-factor,和更适当得糖基化。,(5)分泌的自身蛋白少 有利于表达分泌蛋白的分离纯化。(6)毕赤酵母中存在过氧化物酶体,表达的蛋白贮存其中,可免受蛋白酶的降解,而且减少对细胞的毒害作用。,近年来越来越多的大分子蛋白在该表达体系中得到高效、稳定表达。毕赤酵母蛋白产物糖基化简单,产物直接以可溶性,天然性形式分泌到胞外。该系统具有高表达、高稳定、高分泌的特点,非常适合于基因工程高密度的发酵培养。采用毕赤酵母表达外源蛋白水平一般能达到500-4000mg/L。,甲醇酵母系统没有Scerevisiae那样长的使用历史,使用甲醇酵母表达重组蛋白时要考虑安全性。此外甲醇有毒不适用于食品工业生产,也是一种火灾隐患。,3、出芽酵母(Kluyveromyces lactis)表达系统,Klactis能在以乳糖为唯一碳源和能源的培养基上生长,如甲醇酵母一样可以利用特殊碳源。在含乳糖的物质上生长时,乳糖被乳糖透过酶吸收,并通过细胞内-半乳糖苷酶代谢成葡萄糖和半乳糖,这样利用乳糖的酶就被强烈诱导。有了可强烈诱导的酶基因的启动子,就可用以表达异源蛋白。,KLactis表达系统与酿酒酵母一样整合型或游离型表达载体。乳酸克鲁维酵母表达分泌型和非分泌型的重组蛋白,乳酸克鲁维酵母表达分泌型和非分泌型的重组蛋白,性能均优于酿酒酵母表达系统。,KLactis整合型质粒将重组DNA插入酵母的rDNA基因可用以提高整合的DNA拷贝数,如pMIRK1的质粒可在非选择生长条件下保持约每个细胞60拷贝,这与染色体外质粒相比,具高产和高稳定性优势。,KLactis整合型质粒以Klactis 的1.6m环状质粒pDK1为基础的表达质粒,能在Klactis中复制,采用URA3基因或KmR的Tn90基因建立表达载体。这种质粒约每个细胞70拷贝,并有很高的可诱导性。即便在无选择压力的条件下,也能稳定遗传40代以上。,4、酵母表达系统的缺陷和初步解决方法,遗传和转录的稳定性常受影响,如点突变等,这可能会改变表达蛋白的特性这可通过大量的基因拷贝数解决,因为突变会被大量的正常基因覆盖掉。,翻译的产物不稳定,容易被降解。可利用液泡蛋白酶缺陷型菌株来解决,以防止产物降解。,翻译的错误,可通过对DNA修改来防止。如选用酵母中合适的密码子以避免错误地插入tRNA和由于使用酵母中稀有密码子而引起的翻译中断和移位,以提高正确的翻译产物产量。,酵母对分泌蛋白的修饰度一般很高,而且修饰模式也与高等真核生物有很大差别。因此在酵母中,异源蛋白的表达相对是比较低的。要得到有活性的成熟产物,选择翻译后具修饰能力的酵母以及合适的载体。,生产分泌蛋白时,能够糖基化和形成二硫键,而且能在信号肽的引导下进行分泌,但用KEX2蛋白酶除去-因子的前导肽序列常不够完全,导致分泌蛋白有一个过长的氨基酸末端。这可采用氨基末端间隔序列解决,在-因子的前导肽序列和产物之间加1个间隔序列,这个间隔序列肽可在体外或体内用特异蛋白酶或酵母天冬氨酰蛋白酶切除。,糖基化 酵母能进行N-糖基化,但主要是甘露糖型,还会发生过糖基化,而这样的糖基化会导致潜在