基因组测序技术课件.ppt
《基因组测序技术课件.ppt》由会员分享,可在线阅读,更多相关《基因组测序技术课件.ppt(121页珍藏版)》请在三一办公上搜索。
1、基因组测序技术,一些主要模式生物基因组测序概况,1995年 7月,第一个基因组流感嗜血杆菌(Haemophilus influenzae)的全序列发 表,大小为1.8 Mb;1996年 10月,酿酒酵母(Saccharomyces cerevisiae)的基因组全部测序完成;1997年 9月,大肠杆菌(Escherichia coli)基因组全部测 序完成,全长5 Mb;2001年 12月,线虫(Caenorhabditis ele gans)基因组测序完成.,一些主要模式生物基因组测序概况,2000年:3月,Celera公司完成果蝇(Drosophila me lanogaster)基因组(
2、180 Mb)的全部测序工作,在当时所有已测序的基因组中是最大的,同时这也证明了“全基因组鸟枪法”的可行性;2000年 12 月,第一个植物基因组拟南芥(Arabidopsis thaliana)基因组被全部测序,大小为125 Mb.,一、测序流程1.构建生物基因组文库或cDNA文库 DNA的提取和制备酶切制备克隆用DNA片段 与载体连接转化受体细胞 筛选鉴定扩增培养。2.从基因组文库中提取DNA大片段,进行测序:将DNA用超声波(或限制性内切酶)切成能够测序的小片断(200-500bp)小片断和载体结合,植入细菌中进行扩增(或用PCR扩增)从细菌中提取出繁殖好的质粒 酶切,制取测序的DNA片
3、段3.测序:上测序仪测序。4.利用重叠技术,排出DNA大片段的序列。,二、DNA测序的方法双脱氧链终止法测序化学降解法测序自动化测序非常规DNA测序,(一)Sanger的双脱氧链末端终止法,1.基本原理:通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。,Cambridge的F.Sanger在1977年发明用双脱氧链终止法测定单链DNA的序列,其基本原理如下:DNA聚合酶能够用单链DNA作为模板,合成准确的DNA互补链;该酶能够用2,3-双脱氧核苷三磷酸作底物并将其聚合到新生寡核苷酸链的3-末端,从而
4、终止其延伸反应。在DNA测序反应中,加入模板DNA,引物(特异性引物),DNA聚合酶,dA,dT,dG,dC和一种ddNTP。常用Klenow大片段,无53外切酶活性。,基本原理:,2.技术路线与要求,制备单链模板 将单链模板与一小段引物退火 加入DNA多聚酶 4种脱氧核苷酸分别加入少量4种双脱氧核苷酸 将4种反应产物分别在4条泳道电泳 根据4个碱基在4条泳道的终止位置读出基因序列,A 克隆于质粒中DNA用碱或热变性B M13克隆单链DNAC 噬粒克隆DNAD PCR产生单链DNA,A 高酶活性B 无53外切酶活性C 无35外切酶活性,ddATP/ddCTP/ddGTP/ddTTP 的3碳原子
5、连接的是氢原子,不是羟基,5P,P 5,3HO,OH 3,5P,OH 3,P32 5,5P,OH 3,HO,DNA聚合酶,dATP,dTTP,dGTP,dCTP,ddGTP,ddATP,ddTTP,ddCTP,制备单链DNA,加放射性引物,ddGTP,ddATP,ddTTP,ddCTP,聚合产物分别在4个泳道电泳,从下到上依次读出DNA片段的核苷酸序列,(二)Maxam-Gilbert的化学降解法,1.基本原理 是用化学试剂处理具有末端放射性标记的DNA片段,造成碱基的特异性切割并产生一组具有不同长度的DNA链降解产物,经凝胶电泳分离和放射自显影之后,可直接读出待测DNA片段的核苷酸序列。,2
6、 技术路线,将双链DNA样品变为单链 每个单链的同一方向末端都用放射性同位素标记,以便显示DNA条带 分别用不同方法处理,获得只差一个核苷酸的降解DNA群体 电泳,读取DNA的核苷酸顺序,Maxam-Gilbert测序法的特异断裂,AT,ATCGAT,Specific Reaction to G,化學法,無放射線片段不能顯像,Maxam-Gilbert 法所用的化学技术,5P,P 5,3HO,OH 3,5HO,OH 5,3HO,OH 3,532P,P32 5,3HO,OH 3,532P,OH 3,硫酸二甲酯,甲酸,肼,肼NaCl,G,G+A,T+C,C,碱性磷酸单酯酶,除去 5磷酸基,多核苷酸
7、磷酸激酶,-32P-ATP,分离单链DNA,分别在4个试管中进行特异断裂,断裂产物分别在4个泳道电泳,从下到上依次读出DNA片段的核苷酸序列,化学法测序实例,哌啶,改进的特异化学切割反应,(三)自动化测序,1.基本原理 与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,ddTTP标记绿色荧光.由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基.,(四)非常规测序1.毛细管电泳 用毛细管电泳取代聚丙烯凝胶平板电泳,节省时间,加快测序进程,其他程序同链终止法或化学测序法.2.光点测序 脱氧
8、三磷酸核苷酸连接到DNA 3-末端时会释放1个焦磷酸(PPi),焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮.由此,往反应液中每次只加入1种核苷酸,当加入的核苷酸结合时,反应液发出亮点,并记录核苷酸种类;当核苷酸未结合时,反应液中的核苷酸酶迅速分解此核苷酸,由此来测定DNA序列.,3.DNA芯片测序 基本原理 将各种排列顺序的寡核苷酸点播在芯片上,每个点播的寡核苷酸在排列的方阵中都有指定的位置.待检测的DNA分子与芯片温浴,凡是能杂交的寡核苷酸都会在确定位置发出信号,然后根据获取的信息将寡核苷酸的顺序进行对比组装,拼接成完全的DNA顺序.,利用基因芯片进行杂交测序的原理,三、测序及序列的组
9、装的策略,(一)随机测序与序列组装 随机测序也称”鸟枪法”.,A,B,C,小片段测序,计算机拼装,鸟枪法(Shotgun)测序的问题,CAATGCATTAGCAGCCAATGC,GAP,错装,实例:流感嗜血杆菌基因组的测序及顺序组装,超声波打断纯化的基因组DNA 琼脂糖电泳收集1.62.0Kb的区段、纯化 构建到质粒载体中 随机挑选19687个克隆,进行28643次测序,得到可读顺序为11 631 485 bp 组装成140个覆盖全基因组范围的独立的顺序重叠群,各重叠群间仍有间隙 顺序间隙 物理间隙,载体或宿主菌 选用不当而被丢失的顺序,测序时遗漏的测序,解决办法:通过相邻已知顺序作为探针筛选
10、已有的基因组文库,解决办法:利用其它宿主菌与载体重新构建文库,序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.优点:不需预先了解任何基因组的情况.,A,B,C,A,B,C,A,B,C,A,B,C,小片段测序,计算机拼装,(二)限制测序,限制测序:是指将一段染色体区段的DNA 顺序进行组装.一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法.如高等植物拟南芥基因组的测序完全依据克隆重叠群,先进行各个BAC克隆的随机测序,再进行序列组装;水稻基因组测序计划采取得策略与此相同.,(三)指导测序与序列组装,建立在基因组图谱基础上的”鸟枪法”,即所谓”
11、指导鸟枪法”或”指导测序”。在人类基因组进入测序组装阶段就采用此方法,其基本步骤如下:A 构建平均为2Kb的人类基因组质粒文库,进行双向测序;B 构建平均10Kb的人类基因组质粒文库,进行双向测序,读取2个端部顺序;C 参考人类基因组图,特别是大量的STS位标作为基点,进行序列组装,排成重叠克隆群.,先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群(Contig),分别测序后拼装.这种策略叫基于克隆群(contig-based)的策略.,A,B,C,A,B,C,大片段contig,小片段测序拼装,两种策略的比较,鸟枪法策略 指导测序策略不需背景信息 构建克
12、隆群(遗传、物理图谱)时间短 需要几年的时间 需要大型计算机得到的是草图(Draft)得到精细图谱,(四)其他测序路线,1.重要区域优先测序 人们对感兴趣的基因或与疾病相关的基因优先测序.如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序.,2.EST(Expressed sequence tag)测序 EST是一种重要的基因组图分子标记,以EST为探针很容易从 cDNA文库中筛选全基因,又可从BAC克隆中找到其基因组的基因序列.优点:A mRNA 可直接反转录成cDNA,而且cDNA文库也比较容易构建;B 对cDNA文库大量测序,即可获得大量EST的序列;C ES
13、T为基因的编码区,不包括内含子和基因间区域,一次测序的结果足以鉴定所代表的基因;,四、人类基因组计划,人类基因组计划(Human genome project)于1990年启动,我国于1999年加入该计划,承担其中1%的任务,即人类3号染色体短臂上约30Mb的测序任务。,1.人类基因组计划的目的,阐明人类基因组30亿个碱基对的序列,发现所有人类基因,并搞清其在染色体上的位置;破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我;解码生命、了解生命的起源、了解生命体生长发育的规律;认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。
14、,2.人类基因组草图的完成,2000年6月26日是人类历史上值得纪念的一天。人类基因组的工作草图已经绘制完毕并于这天向全世界公布。最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构,序列错误率低于万分之一。,二000年六月二十六日克林顿宣布人类基因组草图绘制完成,美国国家人类基因组研究所所长弗朗西斯柯林斯在介绍情况。,人类基因组草图基本信息,由31.65亿bp组成含33.5万基因与蛋白质合成有关 的基因占2%,人类基因组,2000年6月公共领域测序计划工作框架图,2001 年2月16日 人类基因组“精细图”完成,(99%),2003年4月14日 人类基因组序列图亦称“完成图”(99.
15、99%),提前绘制成功,A.Celera Genomics 人类基因组的测序策略,3.人类基因组测序策略,采集5个自愿者的DNA样品,构建3种不同插入子大小的基因组文库2Kb,10Kb和50Kb,完成约2700万次插入子末端测序,总长14800Mb,GeneBank下载104018个BAC末端顺序,PFP发表的公开数据主要为BAC克隆的顺序,共4443.3Mb,随机测序与序列组装方法和指导测序与序列组装方法相结合进行序列组装,B 国际人类基因组测序策略构建BAC克隆 限制性酶处理获得指纹 根据指纹重叠方法组建BAC克隆重叠群 根据STS标记,将BAC克隆重叠群标定在物理图上 每个BAC克隆内部
16、采用鸟枪法测序,组装 将BAC插入顺序与BAC克隆指纹极重叠群对比,将已阅读的顺序锚定到物理图上,4.人类基因组测序结果,基因数是3万、4万还是10万 人类遗传基因数量比原先估计的少很多。目前研究表明,人类基因组中约有3万至4万个蛋白编码基因,仅仅是果蝇基因数目的两倍,人有而鼠没有的基因只有300个。此结论是由两大科研小组的数据是从DNA水平上得出的;而“人类有10万多个基因”则是从RNA水平上得出的结论。所以,这些数据不能推翻“人类有10万个基因”的说法。,人类基因组研究的惊人发现,19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少目前已经发现和定位了26000多个功能基因,其中
17、尚有42%的基因尚不知道功能人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”不包含或含有极少基因的成分。基因组上大约有14的区域没有基因的片段。353的基因包含重复的序列。这说明那些原来被认为是“垃圾”的DNA也起重要作用,应该被进一步研究。,什么是单核苷酸多态性,人类999的基因密码是相同的,而差异不到01,不同人群仅有140万个核苷酸差异。这些差异是由“单一核苷酸多样性”(SNP)产生的,它构成了不同个体的遗传基础,个体的多样性被认为是产生遗传疾病的原因。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之
18、间并没有本质上的区别。,5.人类基因组计划的意义,随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发生巨大变化。人类基因研究的意义在于它可以支持和推动生命科学中一系列重要的基础性研究。如基因组遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、生产、分化的分子机理,疾病发生的机理等。,(1)确定人类基因组中约5万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。(2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。,(3)从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”的大小和组织,了解各种不同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 技术 课件
链接地址:https://www.31ppt.com/p-3005336.html