基因功能研究技术之基因敲除及基因编辑技术课件.ppt
基因功能研究技术,基因敲除、基因编辑技术,II、基因敲除:可以使基因的功能完全缺失,基因敲除,又称基因打靶,是一种遗传工程技术,是在转染细胞中发生外源打靶基因与核基因组目标基因之间的DNA同源重组,能够使外源基因定点地整合到核基因组的特定位置上,从而达到改变细胞遗传特性的目的。传统的基因敲除技术依赖于细胞内自然发生的同源染色体的随机交换,但在体细胞内,基因同源重组的效率特别低(低于10-6),增加了实际操作的工作量,限制了该项技术的应用。1987年,Thompsson首次建立了完整的ES细胞基因敲除的小鼠模型,此后基因敲除技术得到进一步的发展和完善,目前该技术已经成为研究基因功能最直接、最有效的方法之一。,基因敲除技术分为完全基因敲除、条件型基因敲除、诱导型基因敲除。完全基因敲除是指通过同源重组法完全消除细胞或动物个体中的靶基因活性。条件型基因敲除是指通过定位重组系统实现特定时间和空间的基因敲除。诱导型基因敲除是通过对诱导剂给予时间的控制,在动物的一定发育阶段和一定组织细胞中实现对特定基因进行敲除的技术。,基因载体的构建:把目的基因和与细胞内靶基因特异片段同源的DNA 分子都重组到带有标记基因(如neo 基因,TK 基因等)的载体上,成为重组载体。基因敲除是为了使某一基因失去其生理功能,所以一般设计为替换型载体。,(一)完全基因敲除,基因被完全敲除之后使得表型分析受到很多限制: 有些重要的靶基因被敲除后会引起胚胎早期死亡,使得无法分析该基因在胚胎发育晚期和成年期的功能;某些基因在不同的细胞类型中执行不同的功能,完全敲除会导致突变小鼠出现复杂的表型,使研究者很难判断异常的表型是由一种细胞引起的,还是由几种细胞共同引起的。,(二)条件型基因敲除,条件型基因敲除法可定义为将某个基因的敲除限制于小鼠某些特定类型的细胞或发育的某一特定阶段的一种特殊的基因敲除方法。该系统在80年代被引入后,已成功被应用于酵母菌、植物、哺乳动物细胞及小鼠身上。现阶段条件型基因敲除以噬菌体的Cre/Loxp系统和酿酒酵母的FLP/FRT系统应用最为广泛。,Cre-LoxP重组酶系统,Cre-LoxP重组酶系统在新型基因打靶中获得广泛应用,是条件型基因打靶、诱导型基因打靶、时空特异性基因打靶策略的技术核心。,Cre-LoxP重组酶系统,Cre重组酶:于1981年从P1噬菌体中发现,属于 Int酶超基因家族。Cre重组酶基因编码区序列全长1029bp(EMBL数据库登录号X03453),编码38kDa蛋白质。Cre 重组酶是一种由 343 个氨基酸组成的单体蛋白。它不仅具有催化活性,而且与限制酶相似,能识别特异的 DNA 序列,即 loxP 位点,使 loxP位点间的基因序列被删除或重组。Cre重组酶有70%的重组效率,不借助任何辅助因子,可作用于多种结构的 DNA 底物,如线形、环状甚至超螺旋 DNA。,Cre-LoxP重组酶系统,LoxP(locus ofX-overP1)序列:来源于P1噬菌体,是有两个13bp反向重复序列和中间间隔的8bp序列共同组成,8bp的间隔序列同时也确定了LoxP的方向。Cre在催化DNA链交换过程中与DNA共价结合,13bp的反向重复序列是Cre酶的结合域。其序列如下 :5 - ATAACTTCGTATA - ATGTATGC - TATACGAAGTTAT - 3 3 - TATTGAAGCATAT - TACATACG - ATATGCTTCAATA - 5,Cre-LoxP系统的特性,条件性基因敲除法可定义为将某个基因的修饰限制于小鼠某些特定类型的细胞或发育的某一特定阶段的一种特殊的基因敲除方法。它实际上是在常规的基因敲除的基础上,利用重组酶Cre介导的位点特异性重组技术,在对小鼠基因修饰的时空范围上设置一个可调控的“按钮”,从而使对小鼠基因组的修饰的范围和时间处于一种可控状态。,Cre/loxP系统作用原理示意图,FLPFRT 系统,该系统与CreloxP系统相同,也是由一个重组酶 和一段特殊的DNA序列组成。从进化的角度上考虑,FlpFRT系统是CreloxP系统在真核细胞内的同源系统。其中,重组酶Flp是酵母细胞内的一个由423个氨基酸组成的单体蛋白。与Cre相似,Flp发挥作用也不需要任何辅助因子,同时在不同的条件下具有良好的稳定性。该系统的另一个成分Flp识别位点(Flp recognition target,FRT)与loxP位点非常相似,同样由两个长度为13bp的反向重复序列和一个长度为8 bp的核心序列构成。在该系统发挥作用时,FRT位点的方向决定了目的片段的缺失还是倒转。这两个系统比较明显的区别是它们发挥作用的最佳温度不同,Cre重组酶发挥作用的最佳温度为37,而Flp重组酶为30。因此,CreloxP系统最适宜在动物体内使用。loxP和FRT位点的序列如图所示,这一技术亦存在一些缺点:费用太高周期较长许多基因在剔除后并未产生明显的表型改变,可能是这些基因的功能为其他基因代偿所致,条件型基因打靶的优势:克服了重要基因被敲除所导致的早期致死并能客观、系统地研究基因在组织器官发生、发育以及疾病发生、治疗过程中的作用和机制,(三)诱导型基因敲除,诱导型基因敲除法也是利用Cre/Loxp系统为基础,利用控制Cre表达的启动子的活性或所表达的Cre酶活性具有可诱导的特点,通过对诱导剂给予时间的控制从而在动物的一定发育阶段和组织细胞中实现对特定基因的敲除。,由Cre/Loxp系统和诱导系统两个部分组成。Loxp转基因动物是用常规基因打靶技术构建成的,基因组中待修饰区域两端各携带1个Loxp位点的转基因动物。诱导系统是指所携带的Cre基因的表达或所表达的Cre的酶活性具有可诱导性的转基因动物。人们可以通过对诱导剂给予时间的预先设计来对动物基因敲除的时空特异性进行人为控制,以避免出现死胎或动物出生后不久即死亡的现象。常见的几种诱导型基因敲除类型有:四环素诱导型;干扰素诱导型;激素诱导型;腺病毒介导型。,III、基因编辑技术,ZFN系统TALEN系统CRISPR/Cas 系统,(一)ZFN技术系统,ZFN 技术原理,锌指核酸酶(Zinc-finger nucleases, ZFN)是人工改造的限制性核酸内切酶,利用不同的锌指结构识别特异DNA序列,利用核酸酶切断靶DNA。,锌指结构中每一个螺旋可以特异识别3-4个碱基;人工设计识别特异DNA序列的螺旋采用如上的通用序列,通过改变其中7个X来实现识别不同的三联体碱基,TGEK是多个螺旋间的连接序列;构建成对人工锌指结构域和FokI融合蛋白(ZFN)可以在指定区域切断DNA双链。,单个ZFN的DNA结合结构域一般包含3-6个Cys2-His2锌指结构域,每个锌指结构域能特异识别1个三联体碱基,与锌指蛋白相连接的非特异性核酸内切酶来自FokI的C端96个氨基酸残基组成的DNA剪切域,每个FokI单体与一个锌指蛋白组相连构成一个ZFN,识别特定的位点,但2个识别位点相距6-8bp距离时,2个单体ZFN相互作用产生酶切功能。在此特异位点产生1个DNA双链切口,然后利用固有的同源重组或非同源末端连接修复机制进行切口修复。从而达到对精确位点进行定点修饰的目的。,ZFN 技术,锌指核酸酶介导的定向染色体删除,研究人员可以利用ZFN技术进行各种基因编辑,比如基因敲除。已建立有ZFN库,识别多种DNA序列,但还不能达到识别任意靶DNA的目的,其应用受到一定的限制。,ZFN技术已成功应用于黑长尾猴、大鼠、小鼠、中国仓鼠、斑马鱼、果蝇、海胆、家蚕、拟南芥、烟草、玉米、猪、牛、人类iPS细胞等,此外,该技术已经有用于治疗HIV的ZFN药物进入二期临床实验。但是,该技术制备复杂,成本昂贵,而且其技术专利被少数几家商业公司控制。,(二),崭新的技术 - TALEN经典的挑战 染色体DNA序列的人工编辑修改 (点)突变:Silent;Missense; Nonsense;Frame shift (基因敲除,Knockout) 片段删除 片段插入目的与用途:生物模型;表达工具;基因治疗,崭新的技术解决经典的挑战,靶向基因技术,经典方法 :自杀质粒,同源重组 几率低(1 HR event per 106 cells),难!饱含希望与失望的技术:ZFN,被Sigma公司垄断新的里程碑:TALEN,TALEN技术,基于TALEN (transcription activator-like (TAL) effector nucleases,类转录因子效应物核酸酶)的靶向基因敲除技术是一种崭新的分子生物学工具,现已应用于细胞、酵母、斑马鱼与大鼠等各类研究对象。技术原理:表达一个重组核酸酶,在靶点识别结构域的作用下,核酸酶识别靶点核酸序列,并发挥内切酶活性,从而打断目标基因,完成基因敲除的过程。,1989年 植物病原体黄单胞菌属 (Xanthomonas spp.) avrBs3 基因被克隆。2007年 发现其序列特异性核酸结合特性, avrBs3 TA2009年 Xanthomonas TA氨基酸序列与核酸靶序列的对应关系被破译 由34个aa组成一个单元模块,重复17 -18次 34个aa中的第12和13个氨基酸(Repeat Variant Di-residue, RVD) 对应识别一个目标碱基,TALEN 发展过程,人工构建TALE模块识别指定核酸序列,102碱基模块单元, 14 18个重复,真核表达,特异识别指定的14 -18 个核酸序列并与之结合,34氨基酸单元,TALEN 发展过程,TALEN (TALE+FOK I) 表达质粒对,TALEN 基因敲除,X 2,TALEN 表达质粒对转染、表达切割靶位点,切割诱发DNA损伤修复机制(nonhomologous end-joining,NHEJ)。由于在此修过程中总是有一定的错误率存在。在修复中发生移码突变错误的个体即形成目标基因敲除突变体,TALEN介导的同源重组,同源重组发生率升高几个数量级,HR,Left arm,Right arm,Left arm,Right arm,点突变,片段删除,基因敲入,2011年8月, Nature Biotechnology 上同时发表了用TALEN 技术进行基因敲除的4篇研究文章,另加一篇综述。 一篇人类干细胞 Genetic engineering of human pluripotent cells using TALE nucleases 一篇大鼠Knockout rats generated by embryo microinjection of TALENs 两篇斑马鱼 Targeted gene disruption in somatic zebrafish cells using engineered TALENs Heritable gene targeting in zebrafish using customized TALENs 一篇综述Move over ZFN,TALEN的最前沿,TALEN靶向(基因敲除)技术基本流程,选择、确定靶点2. TALE识别模块串联构建3. TALEN真核表达质粒构建4. TALEN真核表达质粒转入(卵)细胞,表达TALEN重组蛋白5. 检测突变效率,筛选(移码)突变体,X 2,X 2,X 2,靶点的DNA序列特征:相隔17-18bp的两段14-18bp序列作为靶点参考文献:Cermak et al., Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting, Nucleic Acids Research, 2011, Vol. 39, No. 12, e82. 在线靶点选择设计软件:https:/boglab.plp.iastate.edu/node/add/talef-off/,选择确定TALE靶点,TAL的核酸识别单元为34aa模块中的双连氨基酸(RVD) RVD与A、G、C、T有恒定的对应关系,即NI识别A,NG识别T,HD识别C,NN识别G,非常简单明确 欲使TALEN特异识别某一核酸序列(靶点),只须按照靶点序列将相应TAL单元(14 -18个)串联克隆即可。,TALE识别模块串联构建,具专利保护的克隆构建系统,具专利保护的克隆构建系统,步骤一:靶点识别单元串联,步骤二:TALEN表达质粒构建,具专利保护的克隆构建系统,将靶点识别模块克隆入真核表达载体,得到Talen质粒对靶点识别模块串接成功后需克隆入真核表达载体中。此真核表达载体含有TAL的其它必需结构域并在C端融合有FokI序列。目前,TALEN系统利用FokI的内切酶活性打断目标基因。因FokI需形成2聚体方能发挥活性,在实际操作中需在目标基因中选择两处相邻(间隔17碱基)的靶序列(14 - 18个碱基)分别进行TAL识别模块构建。,X 2,真核表达TALEN质粒对,步骤三. 将TALEN质粒对共转入细胞中实现靶基因敲除TALEN质粒对共转入细胞后,其表达的融合蛋白即可分别找到其DNA靶位点并与靶位点特异结合。此时,两个TALEN融合蛋白中的FokI功能域形成二聚体,发挥非特异性内切酶活性,于两个靶位点之间打断目标基因。,FOKI 内切酶打断靶点区,内切酶的切割诱发DNA损伤修复机制(nonhomologous end-joining,NHEJ)。由于在此修过程中总是有一定的错误率存在。在修复中发生移码突变错误的个体即形成目标基因敲除突变体。,突变体形成,PCR 酶切法 利用靶点设计时挑选的,位于相邻靶位点之间的特异性内切酶位点,进行PCR产物酶切鉴定。 当左右靶点之间没有合适的酶切位点时可使用CEL-I核酸酶检测。 经验规律:= 2%可用,=10%很好,TALEN切割效率检测,TALEN切割效率检测,启动子 ABCDEF stop-Target site - DEFHIJK,启动子 ABCDEFHIJK,共转染荧光素酶检测质粒+TALEN质粒 1+TALEN质粒 2,荧光素酶检测法,发光倍数与切割效率之间的定量关系尚缺乏充分研究。有文献表明,发光倍数达1.5至2倍即可有效获得突变体。,突变体筛选,有限稀释法获得单细胞克隆 PCR-酶切法鉴定 PCR测序确认,基本工具质粒,14 18bp靶点序列,怎样做TALEN,1单元模块质粒:A,G,C, T共4种2单元模块质粒:4X4=16种TALEN表达载体:基于PCS2质粒2种,怎样做TALEN,怎样做TALEN,TALEN技术成功率影响因素,重组TALEN模块与靶位点的 亲合力靶点序列设计原则来自20个天然TLAE的统计规律细胞系固有特性K562容易,293中等,MC-10困难细胞转染效率不同细胞系转染效率不同,293高, HeLa低所期待的目标Heterozygous?Homozygous?Exact point mutation?Selection marker insertion?,TALE技术应用范围,细菌:尚无报道,已另有多种高效靶向技术。真菌:有报道,TALE原理可行。植物:TALE原理发现于植物,需特定转基因技术。动物细胞:TALE原理可行,各细胞系效率不一。斑马鱼:有TALEN基因敲除报道,尚无点突变与敲入报道。小鼠、大鼠原理肯定可行,但尚无报道(技术太新,转基因动物构建实验周期较长)。TALEN应用扩展的技术关键:切实可靠的表达系统。高效的转基因及克隆筛选技术。,TALEN的植物应用,Ting Li et. al. High-efficiency TALEN-based gene editing produces disease resistant rice, volume 30 number 5 may 2012 Nature Biotechnology 背景水稻病原菌 Xanthomonas oryzae pv. oryzae (Xoo)导致细菌性白叶枯病。细菌天然 TALE AvrXa7 or PthXo3 与水稻Os11N3基因 启动子结合,调控(hijack)此基因上调表达,促进细胞内糖份向细胞外转运,便于病原菌利用。 策略以TALEN对细菌TALE靶点区做突变,使细菌TALE无法与水稻Os11N3基因 启动子结合。 结果突变水稻获得抵御细菌感染的能力,TALEN与主要类同技术比较,siRNA优于TALEN可瞬时转染快速观察效果Knockdown效果确实,可用于必须基因逊于TALEN瞬时转染效果短暂不是彻底knockout慢病毒稳转发生染色体随机整合ZFN优于TALEN经验积累多,技术较成熟逊于TALEN技术复杂,难度高,被Sigma公司垄断靶点序列要求高,难找Off-targeting现象严重经常有显著细胞毒性,基因组精密工程,今年来自梅奥医学中心的研究人员第一次利用人工酶切割一段基因序列中的部分DNA,并用合成DNA取代它们,对斑马鱼基因组部分序列进行了定制修改。这种技术称为转录激活因子样效应物核酸酶(transcription activator-like effector nucleases ,TALENs)方法,相比ZFNs和 morpholinos,TALENs具有几个优势:它们更便宜、更有效,尤其是以一种开发活性形式应用时。ZFNs只能靶向特异序列,而TALENs有潜力对任何的DNA序列起作用。Morpholinos的效应是短暂的,而TALENs可造成永久性的改变。随后科学家们在蟾蜍等其它动物中展开了这方面的研究,证明这种技术与已证实的基因靶向技术一样有效。国内清华大学的施一公和颜宁等人也于今年在Science杂志上报道了TALE特异识别DNA的分子机理,这提供了TALE蛋白的改造基础,极大地拓宽了TALE蛋白在生物技术应用上的前景。,2012年,TALEN被科学杂质评为十大科学突破之一。,新技术介绍,(三)CRISPR-Cas系统基因修饰技术Clustered regularly interspaced short palindromic repeats(CRISPR)/CRISPR-associated (Cas)9,Biotechnology: Rewriting a genomeNature495,5051(07 March 2013)doi:10.1038/495050a,1 CRISPR-Cas系统的发现:,1987年,日本大阪大学(Osaka University)在对E.coli K12编码的碱性磷酸酶(alkaline phosphatase)基因进行研究时,发现在这个基因编码区域的附近存在一小段不同寻常的DNA片段,这些片段是由简单的重复序列组成的,而且在片段的两端还存在一段不太长的特有的序列。2002年,科学家将其正式命名为Clustered regularly interspaced short palindromic repeats(CRISPR)。随着基因组测序,发现90%的古细菌、40%的细菌基因组中含有CRISPR位点。有的甚至含有2-3个位点。2013以后,研究者们在包括science和nature biotechnology等著名杂志上发表多篇文章介绍CRISPR-Cas系统,并且已成功在人类、小鼠、斑马鱼等物种上实现精确的基因修饰。,CRISPR-Cas主要由两部分组成:,识别,切割,2 CRISPR-Cas系统的组成:,CRISPR-Cas是很多细菌和大部分古生菌的天然免疫系统,通过对入侵的病毒和核酸进行特异性的识别,利用Cas蛋白进行切割,从而达到对自身的免疫。,2.1 CRISPR位点的结构,CRISPR:(clustered regularly interspaced short palindromic repeats) CRISPR 是一个特殊的DNA重复序列家族, 广泛分布于细菌和古细菌基因组中。CRISPR 位点由一个前导区(leader)、多个高度保守的重复序列(repeat)和多个间隔区(spacer)组成,重复序列的长度通常 2148 bp, 间隔序列2672 bp (spacer) 。重复序列具有二重对称性,部分间区序列与某些已知的质粒、噬菌体序列相匹配。CRISPR就是通过这些间隔序列(space)与靶基因进行识别。,2.2 Cas家族,Cas(CRISPR associated): 存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guide RNA引导下对靶位点进行切割。它与folk酶功能类似,但是它并不需要形成二聚体才能发挥作用。,根据Cas 基因核心元件序列的不同, CRISPR/Cas 免疫系统被分为3 种类型:型、型和型。型和型CRISPR/Cas 免疫系统需要多个Cas 蛋白形成复合体切割DNA 双链, 而型CRISPR/Cas免疫系统只需要一个Cas9 蛋白来切割DNA 双链,目前型系统是被改造的最为成功的人工核酸酶。,CRISPR/Cas 的基因座结构相对简单。以产脓链球菌(Streptococcus pyogenes SF370)的典型Type CRISPR/Cas 为例,其基因座结构可分别三部分,5 端为tracrRNA 基因,中间为一系列Cas蛋白编码基因, 包括Cas9、Cas1、Cas2 和Csn2,3 端为CRISPR 基因座,由启动子区域和众多的间隔序列(spacers)和重复序列(direct repeats)顺序排列组成。,3. Type CRISPR/Cas 系统的结构及作用机理,crRNAs:CRISPR 位点的第一个重复序列上游有CRISPR 前导序列(Leader sequence),该前导序列可以作为启动子, 启动CRISPR 序列的转录。多个研究表明CRISPR 基因座首先被转录成前体CRISPR RNA(pre-crRNA),然后在Cas 蛋白或是核酸内切酶的作用下被剪切成一些小的RNA 单元,这些小RNA 即为成熟crRNA,由一个间隔序列和部分重复序列组成,被命名为CRISPRRNAs(crRNAs), 这些crRNA和Cas 蛋白共同参与 CRISPR 免疫防御过程 。,tracrRNA:他们发现tracrRNA (trans-activating crRNA)对靶点的识别和切割是必需的,tracrRNA 的5 端与成熟的crRNA 3 端有部分序列(约13 bp)能够配对进而形成茎环结构,对维持crRNA 与靶点的配对可能十分重要。其指导RNase和Cas9 完成前体crRNA 的成熟,随后tracrRNA 还能与成熟的crRNA 的重复序列配对形成RNA 二聚体,进而和Cas9 蛋白结合成核糖核蛋白复合体,发挥识别和降解入侵的外源DNA 功能。根据tracrRNA 与crRNA 的结构特性,他们将tracrRNA 和crRNA 表达为一条嵌合的向导RNA(guide RNA, gRNA), 并在体外证明gRNA 可以发挥tracrRNA 和crRNA 的功能,在目的基因处切割,形成DSBs, 该过程是CRISPR/Cas 对基因组进行编辑的基础。,Cas9:体外实验证明Cas9 基因是参与CRISPR 免疫系统的唯一必需基因, Cas9 是由1 409 个氨基酸组成的多结构域蛋白, 含有2 个核酸酶结构域:氨基端的RuvC-like 结构域及位于蛋白中间位置的HNH 核酸酶结构域, HNH 核酸酶结构域可以切割与crRNA 互补配对的模板链, 切割位点位于原型间隔序列毗邻基序(Protospacer adjacent motif, PAM)上游3nt 处,RuvC-like 结构域可以对另一条链进行切割, 切割位点位于PAM 上游38nt 处。在crRNA 与tracrRNA 形成的双链RNA 的指导下, Cas9 蛋白对靶位点进行切割。此外,他们还证明,将RuvC 或是HNH 活性突变后Cas9 只有单链切割活性,类似于切口酶。,到目前为止, 虽然CRISPR/Cas 系统的详细作用机制尚未完全阐明, 但已基本明确了该作用机制的整个过程, 该过程大体分为3 个阶段:1. 在噬菌体入侵的起始阶段, Cas 蛋白复合物靶向并裂解噬菌体基因组中的原型间隔序列(protospacer), protospacer接下来整合到宿主基因组的CRISPR 位点的5端;2. 然后这些短的掺入的protospacer 被转录成crRNA;3. 最后阶段是在Cas 蛋白复合物的参与下, 靶向和干扰侵入的噬菌体DNA 序列。当同种噬菌体再次入侵时, CRISPR的repeats 序列截取和保留的入侵噬菌体的某些DNA 片段形成spacers, spacers 会转录形成一些小的crRNA, 这些crRNA 会与trans-activatingcrRNA(tracrRNA)形成一种双链二级结构, 以此招募Cas 蛋白, crRNA、tracrRNA 以及Cas 蛋白形成复合体, 识别紧随protospacer 序列后的PAM 序列,Cas 蛋白的核酸酶结构域对与crRNA 互补的双链DNA 进行切割, 从而使细菌具有对抗同类噬菌体再次入侵的能力。CRISPR 基因座在没有受到外界压力的情况下表达水平很低,当外源的质粒或是噬菌体入侵宿主菌时CRISPR 的表达很快被诱导上调。,噬菌体或是质粒上与间隔序列对应的序列被称为protospacer,通常protospacer 的5或是3 端延伸几个碱基序列很保守, 被称为PAM(protospacer adjacent motifs),它的长度一般为25碱基,一般与protospacer 相隔14 碱基。新间隔序列的获得可能分为三步:首先识别入侵的核酸和扫描外源DNA 潜在的PAM,将临近PAM 的序列作为候选protospacer;然后在CRISPR 基因座的5端合成重复序列;最后新的间隔序列整合到两个重复序列之间。,4. CRISPR/Cas 系统的应用,CRISPR/Cas 系统的作用特性与限制性核酸内切酶相似,它对序列的特异性切割主要依赖于crRNA 与Cas 蛋白形成的核糖核蛋白复合物识别靶序列上的PAM 以及protospacer 。根据CRISPR/Cas 系统这一特性,将其用于设计人工的核酸内切酶(engineered endonuclease,EEN),用来对我们感兴趣的基因位点进行修饰三类CRISPR/Cas 系统中Type型系统的核糖核蛋白复合物相对简单,除crRNA 和tracrRNA 外,只有Cas9 一个蛋白目前,产脓链球菌(Streptococcuspyogenes SF370)的Type型系统是被改造的最为成功的人工核酸内切酶,已经在人类细胞、小鼠、斑马鱼中成功实现了基因组定点修饰。,4.1 CRISPR-Cas系统靶向要求,最主要的要求:PAM(protospacer-adjacent motif)为NGG。,在人类基因组中,平均每8bp就出现一个NGG PAM。,4.2 Cas介导编辑模板替换,2013年1月29日在nature biotechnology上发表的RNA-guided editing of bacterial genomes using CRISPR-Cas systems一文中,作者利用CRISPR-Cas系统用设计好的DNA模板替换的相应基因来达到基因的定向修饰。,4.3 Cas介导基因修饰,2013年1月29日在nature biotechnology上发表的efficient genome editing in zebra fish using a CRISPR-Cas system一文中,作者利用人工合成的sgRNAs能指导Cas9内源性核酸酶对斑马鱼胚胎基因进行修饰。,Cas9,sg-RNA,2013年2月15日在science上发表的Multiplex Genome Engineering Using CRISPR/Cas Systems一文中,作者利用一个包含两个靶向不同基因的spacers的crRNA实现了同时对两个基因进行编辑。,4.4 Cas介导双基因修饰,5 CRISPR-Cas系统前景分析,这是一项靶向基因修饰的革新技术,一项极具有可能获得诺贝尔奖技术。,2013年4月12日在cell stem cell上发表的Enhanced Efficiency of Human Pluripotent Stem Cell Genome Editing through Replacing TALENs with CRISPRs一文中,作者利用TALENs和CRISPRs对同一基因进行修饰,效率分别为0%-34%和51%-79%。,而且从实际应用的角度来说,CRISPRs比TALENs更容易操作,因为每一对TALENs都需要重新合成,而用于CRISPR的gRNA只需要替换20个核苷酸就行。,只需合成一个sgRNA就能实现对基因的特异性修饰,Cas蛋白不具特异性。编码sgRNA的序列不超过100bp,因此比构建TALENs和ZFNs更简单方便。较短的sgRNA序列也避免了超长、高度重复的TALENs编码载体带来的并发症。可以对任何后面紧随NGG(PAM)的20 bp 的序列进行编辑; 能同时作用于多个靶位点;,技术优势,CRISPRdb 和CRISPI 是两个专门收录CRISPR信息的数据库,CRISPRdb 中包括一些识别和分析CRSPR 的软件工具,数据库由巴黎大学维护(http:/crispr.upsud.fr) 21-22CRSPI 中含有Cas 蛋白和CRISPRs 的数据,补充了CPRISPRdb 的数据(http:/crispi.geneouest.org/),三、随机突变筛选策略,利用转基因、基因敲除等技术从特定基因的改造到整体动物表型分析的“反向遗传学”研究大大推动了功能基因组学的进展,但是也存在明显的局限性: 首先,由于生物体的代偿机制,使得基因敲除动物常常观察不到异常表型; 其次,由于“反向遗传学”只能对已知的基因进行研究,而人类基因组中尚有90%以上的非编码序列处于未知状态; 第三,由于“功能缺失”和“功能获得”小鼠常出现胚胎期死亡,而目前可用于条件性基因改造的启动子还很少,从而阻碍了特定基因在成体动物中的功能分析; 第四,由于一个蛋白有多个不同的功能域,特定基因在不同位点上的突变可能产生不同的表型,应用单一的“功能缺失”方法,显然不可能发现这些不同的异常表型。,因此,单单应用“反向遗传学”不足以完成功能基因组学的任务,而基于“正向遗传学”的,从异常表型到特定基因突变的随机突变筛选策略逐渐受到青睐。,随机突变筛选策略的第一步是通过物理诱变、化学诱变或生物技术产生大量的基因组DNA突变。,基因捕获(gene trapping)技术是一种产生大规模随机插入突变的便利手段,对于揭示基因序列所对应的基因功能具有重要的应用价值。 基因捕获技术的基本过程是:将一含报告基因的DNA载体随机插入基因组,产生内源基因失活突变,通过报告基因的表达,提示插入突变的存在,以及内源基因的表达特点。利用基因捕获可以建立一个携带随机插入突变的ES细胞库, 每一种ES细胞克隆中含有不同的突变基因,ES细胞克隆经囊胚注射发育为基因突变动物模型,通过对动物模型的表型分析鉴定突变基因的功能。,根据细胞的不同,插入载体的选择也有所不同。逆转录病毒可用于动植物细胞的插入;对于植物细胞而言农杆菌介导的T-DNA和转座子比较常用;噬菌体可用于细菌基因敲除。,基因捕获技术可节省大量构建特异打靶载体,以及筛选染色体组文库的工作及费用,成为可同时对基因的序列、基因的表达以及基因的功能进行研究的高效技术。随机突变筛选策略能够获得功能基因研究的新材料及人类遗传性疾病的新模型, 这种“表型驱动”的研究方式有可能成为功能基因组研究最有前景的手段和捷径。,基因功能的鉴定最终仍需要通过实验来验证,尤其是在生物体内从整体水平对基因功能进行研究,是鉴定基因功能的最终解决方案。采用不同技术建立的模式生物是研究基因功能必不可少的工具,各种方法都具有各自的特点和局限性。结合基因功能获得和失活技术,从正反两方面对基因。,小 结,