《基因组学概述》PPT课件.ppt
《《基因组学概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《基因组学概述》PPT课件.ppt(93页珍藏版)》请在三一办公上搜索。
1、第11章 基因组与比较基因组学,11.1 人工染色体构建11.2 高通量DNA序列分析技术11.3 新的测序策略-全基因组鸟枪法测序11.4 全基因组序列分析-基因组学的新内容 11.5 人类基因组计划11.6 比较基因组学(Comparative genomics),11.1 人工染色体构建,1983年,美国的Dana-Farber癌症研究所和哈佛大学医学院的教授首次在Nature上发表文章,报道了构建YAC(Yeast Artificial Chromosome)库的过程。1987年,Burke等人发现,仅仅带有ARS序列(autonomous replicating sequence)的
2、载体虽然能够被复制,但极易在有丝分裂时丢失。即使在选择培养基上,也只有5%-20%的子代细胞带有ARS载体。加入Centromeres(CEN)能显著提高ARS质粒在有丝分裂时的稳定性,90%以上子代细胞带有该载体。CEN还能显著降低拷贝数,从20-50/细胞降为1-2/细胞。(Science,236:806-812)。,人工染色体含有三种必需成分:着丝粒、端粒和复制起点。着丝粒(CEN)位于染色体中央,呈纽扣状结构,在有丝分裂时结合微管并调控染色体的运动,也是姐妹染色单体配对时的最后位点,接收细胞信号而使姐妹染色体分开。端粒(TEL):主要功能是防止染色体融合、降解、确保其完整复制。端粒酶以
3、其自身RNA为模板,在染色体端部添加上端粒重复序列,并参与端粒长度和细胞增殖的调控。,复制起点:DNA复制通常由起始蛋白与特定的DNA序列相互作用开始。,载体的概念:1.要把一个有用的基因(目的基因研究或应用基因)通过基因工程手段送到生物细胞(受体细胞),需要运载工具(交通工具)携带外源基因进入受体细胞,这种运载工具就叫做载体(vector)。2.凡来源于质粒或噬菌体的DNA分子,可以插入或克隆DNA片段统称为vector。3.基因工程所用的vector实际上是DNA分子,是用来携带目的基因片段进入受体细胞的DNA。,载体的分类,说明:1.穿梭载体(sbuttle vector)指在两种宿主生
4、物体内复制的载体分子,因而可以运载目的基因(穿梭往返两种生物之间,如:YEP,DIDB2192.YAC Yeast Artificial Chromsome 由酵母基因和PBR322质粒衍生物构成,对克隆大的真核基因十分有用,在HGP中发挥主要作用。3.BAC 细菌人工染色体。,YAC的主要缺点,1存在高比例的嵌合体,即一个YAC克隆含有两个本来不相连的独立片段;2部分克隆子不稳定,在转代培养中可能会发生缺失或重排;3难与酵母染色体区分开,因为YAC与酵母染色体具有相似的结构。4操作时容易发生染色体机械切割。,以细菌寄主系统为基础的克隆载体形成嵌合体的频率较低,转化效率高,又易于分离。科学家用
5、染色体建造法用F质粒及其调控基因构建细菌载体,克隆大片段DNA。该质粒主要包括oriS,repE(控制F质粒复制)和parA、parB(控制拷贝数)等成分。,BAC的优点,1 易于用电击法转化E.coli(转化效率比转化酵母高10-100倍);2 超螺旋环状载体,易于操作;3 F质粒本身所带的基因控制了质粒的复制;4 很少发生体内重排。,有人把人类染色体端粒DNA上单个-卫星DNA单元多聚化形成1Mb左右的大片段并与人类基因组DNA混合,产生了能被复制、能正常分裂并得到长期稳定保存的人工合成的染色体,长度约为6-10Mb,称为MAC或HAC。,人类基因组,线粒体基因组(16.6kb),核基因组
6、(3200Mb),基因外序列,基因和基因有关序列,约10%,约90%,专一或中等重复序列,Non-coding DNA,假基因,内含子,基因片段,10%,90%,专一的或低拷贝数序列,中度至高度重复序列,2030%,7080%,分散重复序列,串联重复序列/成簇重复序列,约60%,约40%,蛋白编码基因,rRNA基因,tRNA基因,Coding DNA,在大规模DNA测序中,目标DNA分子的长度可达上百万个bp。现在还不能直接测定整个分子的序列,然而,可以得到待测序列的一系列序列片段。序列片段是DNA双螺旋中的一条链的子序列(或子串)。这些序列片段覆盖待测序列,并且序列片段之间也存在着相互覆盖或
7、者重叠。在一般情况下,对于一个特定的片段,我们不知道它是属于正向链还是属于反向链,也不知道该片段相对于起点的位置。另外,这样的序列片段中还可能隐含错误的信息。序列片段的长度范围3001000 bp,而目标序列的长度范围是3100万bp,总的片段数目可达上千个。DNA序列片段组装(sequence assembly),又称序列拼接)的任务就是根据这些序列片段,重建目标DNA序列。如果能够得到DNA一条链的序列,那么根据互补原则,另一条链的序列也就得到了。,11.2 高通量DNA序列分析技术,DNA测序不能从染色体进行,首先必须克隆化,构建基因组的物理图谱。先构建片段DNA克隆(以YAC或BAC为
8、载体),并把克隆依染色体排序,这就是“染色体的克隆图”。依片段DNA克隆在染色体上所在的位置排序,可以得到相互重叠的一系列克隆,叫做“克隆重叠群”(contig)。选取有关的克隆进行DNA测序,就可以“拼装”出整个染色体或基因组的DNA序列。如果克隆片段太大仍不便于直接测序,则需通过亚克隆,构建更小的片段。另外一种方法是对所有相互重叠的亚克隆进行测序,然后直接通过计算机程序根据其重叠部分进行“拼装”。,完整基因组的测序过程一般包括三个步骤:(1)建立克隆的物理图谱:如酵母人工染色体YAC(Yeast Artificial Chromosome)克隆、细菌人工染色体BAC(Bacterial A
9、rtificial Chromosome)克隆等;(2)测定每个克隆的序列;(3)序列拼装和注释:当得到一段DNA序列之后,可以利用序列分析工具,进行序列的拼接;继而通过与数据库序列的比较,得到与该序列相关的信息,如基因、调控元件、重复区域等,进而对序列的生物学特性进行注释。,杂交测序法 质谱法 单分子测序法 原子探针显微镜测序法DNA 芯片法,经典方法:Sanger双脱氧链终止法(Sanger,1977)Maxam-Gilbert DNA化学降解法(Maxam&Gilbert,1977),新技术方法:,Sanger双脱氧链终止法原理:双脱氧链终止法要求使用一种单链的DNA模板和一种适当的DN
10、A合成引物。利用DNA聚合酶的两种酶催化反应的特性:第一,DNA聚合酶能够利用单链的DNA为模板,合成出准确的DNA互补链;第二,DNA聚合酶能够利用2,3-双脱氧核苷三磷酸作底物,使之参入到寡核苷酸链的3-末端,从而终止DNA链的延长。,Dideoxynucleotides(双脱氧核苷酸),ddNTPs 是反应终止剂 可以当作正常碱基参与复制,一旦链入DNA中,其后就不能再继续连接。反应体系中dNTPs的浓度远高于ddNTPs(一般1:34)。,*,少一个OH,脱氧核甘酸与双脱氧核甘酸结构比较,Sanger第一步:加入复制终止剂,荧光检测探头,电泳,看谁跑得快,ddNTPs参与下的DNA复制
11、,Sanger法测序产物的平均链长取决于ddNTP:dNTP的比例,比例高时,得到较短的产物;“标记终止法”测序产物的平均长度可通过标记反应中dNTP浓度(高浓度能得到长的产物)或终止反应的ddNTP:dNTP来调整。,Sanger第二步:荧光检测,Gel Electrophoresis DNA Fragment Size Determination,DNA 带负电DNA在电泳胶中的迁移率与其片段大小有关,Analyzed Raw Data,除核苷酸序列文本文件外,全自动测序仪还提供曲线图。Trace diagrams are analyzed by base calling programs
12、 that use dynamic programming to match predicted and occurring peak intensity and peak location.Base calling programs predict nucleotide locations in sequencing reads where data anomalies occur.Such as multiple peaks at one nucleotide location,spread out peaks,low intensity peaks.,Maxam-Gilbert法,用化学
13、试剂处理末端放射性标记的DNA片断,造成碱基的特异性切割。由此产生的一组具有不同长度的DNA链的反应混合物,经凝胶电泳按大小分离和放射自显影之后,便可根据x光底片上所显示的相应谱带,直接读出待测DNA片断的核苷酸序列。,原理:,碱基特异性化学切割反应:硫酸二甲酯(DMS):使DNA分子中鸟嘌呤(G)上的N7原子甲基化。肼:使DNA分子中胸腺嘧啶(T)和胞嘧啶(C)的嘧啶环断裂;但高盐条件下,只C断裂,而不与T反应。哌啶:从修饰甲基处断裂核苷酸链。在不同的酸、碱、高盐和低盐条件下,三种化学试剂按不同组合可以特异地切割核苷酸序列中特定的碱基。,G反应:DMS使G在中性和高温条件下脱落。G+A反应:
14、酸性条件(如甲酸)可使A和G嘌呤环上的N原子质子化,利用哌啶使A、G脱落。T+C反应:肼(低盐)C反应:肼(高盐)测定DNA长度250bp。,化学裂解法测定DNA的核苷酸序列,杂交法SBH(Sequencing by hybridization)用特定长度的具有所有可能碱基序列的寡核苷酸探针与未知序列的DNA片段杂交。根据某些探针形成的完全双链,推知目的DNA的碱基序列。,步骤:1.将待测的靶DNA分子与一组已知核苷酸序列的寡核苷酸探针进行杂交 2.对能与待测DNA杂交的探针之间的碱基重叠关系作比较分析,据此推算靶DNA的核苷酸序列。,两种操作方式:1.将不同的寡核苷酸与固定在滤膜上的靶DNA
15、序列样品进行杂交 2.应用寡核苷酸矩阵芯片的DNA杂交测序法,全基因组鸟枪法测序的主要步骤,第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。第二,高效、大规模的末端测序。对文库中每一个克隆,进行两端测序,TIGR在完成流感嗜血杆菌的基因组时,使用了14台测序仪,用三个月时间完成了必需的28,463个测序反应,测序总长度达6倍基因组。第三,序列集合。TIGR发展了新的软件,修改了序列集合规则以最大限度地排除错误的连锁匹配。第四,填补缺口。有两种待填补的缺口,一是没有相应模板DNA的物理缺口,二是有模板DNA但未
16、测序的序列缺口。他们建立了插入片段为15-20kb的文库以备缺口填补。,鸟枪法测序的缺点,随着所测基因组总量增大,所需测序的片段大量增加,造成重复测定,也易丢失某些序列,且数据处理分析工作量大。高等真核生物(如人类)基因组中有大量重复序列,导致判断失误。,鸟枪法测序的缺点,对鸟枪法的改进,(1)Clone contig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。(2)靶标鸟枪法(direted shotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。,一些常见的缩写,SSLPs,simple sequence
17、length polymorphisms;STRs,simple tandem repeats;SNPs,single nucleotide polymorphisms.LINEs,long interspersed nuclear elements;SINEs,short interspersed nuclear elements;LTR,long terminal repeat.FISH,Fluorescent in situ Hybridization;STS,Sequence Tagged Site EST,End Sequence Tag.,DNA全序列,切成小段,小段和载体结合,结
18、合后进行测序,Map fragments,Sequence overlappingfragments,Assembledsequence,基因组DNA序列测定示意图 通过随机剪切得到的大分子DNA片段克隆到载体上。绘制出这些重叠片段的图谱,并对重叠片段进行测序,通过“拼装”得到基因组序列。另一种方法不是根据片段的染色体位置,而是根据其重叠部分进行“拼装”。,Sequence all fragments and assemble,11.4 全基因组序列分析-基因组学的新内容 1数据存放。2碱基百分含量分析。无论是GC富含区还是AT富含区,都可能是一些特殊功能的区域。肺炎支原体GC百分含量高和GC
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组学概述 基因组 概述 PPT 课件

链接地址:https://www.31ppt.com/p-5486850.html