基因组测序与分析.ppt
《基因组测序与分析.ppt》由会员分享,可在线阅读,更多相关《基因组测序与分析.ppt(60页珍藏版)》请在三一办公上搜索。
1、第八章 基因组测序与分析,第一节 基因组计划,1、人类基因组计划简介 人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息,基因组 一个物种中所有基因的整体组成,2.人类基因组测序策略,采集5个自愿者的DNA样品,构建3种不同插入子大小的基因组文库2Kb,10Kb和50Kb,完成约27
2、00万次插入子末端测序,总长14800Mb,GeneBank下载104018个BAC末端顺序,PFP发表的公开数据主要为BAC克隆的顺序,共4443.3Mb,随机测序与序列组装方法指导测序与序列组装方法相结合进行序列组装,A.Celera Genomics 人类基因组的测序策略,B 国际人类基因组测序策略构建BAC克隆 限制性酶处理获得指纹 根据指纹重叠方法组建BAC克隆重叠群 根据STS标记,将BAC克隆重叠群标定在物理图上 每个BAC克隆内部采用鸟枪法测序,组装 将BAC插入顺序与BAC克隆指纹极重叠群对比,将已阅读的顺序锚定到物理图上,两种策略的比较,鸟枪法策略 指导测序策略不需背景信息
3、 构建克隆群(遗传、物理图谱)时间短 需要几年的时间 需要大型计算机得到的是草图(Draft)得到精细图谱,3.人类基因组研究的惊人发现,19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”不包含或含有极少基因的成分。基因组上大约有14的区域没有基因的片段。353的基因包含重复的序列。这说明那些原来被认为是“垃圾”的DNA也起重要作用,应该被进一步研究。,4.单核苷酸多态性,人类999的基因密码是相同的
4、,而差异不到01,不同人群仅有140万个核苷酸差异。这些差异是由“单一核苷酸多样性”(SNP)产生的,它构成了不同个体的遗传基础,个体的多样性被认为是产生遗传疾病的原因。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。,5.Shotgun测序及分析,DNA的提取和纯化载体预备:和DNA片断结合,从而能够在细菌中扩增。DNA片段的制备:将DNA用超声波切成能够测序的小片断转化培养:小片断和载体结合,植入细菌中进行扩增。提质粒:从细菌中提取出繁殖好的质粒电泳检测:检测质量的好坏测序:上测序仪测序,DNA整体,切成小段,小段和载体结合,结合后进行测序
5、,还没有完!拼接!,因为整个基因组太长(上M),而每次只能测得一个500的小片断(read)问题:如何根据read恢复原始顺序?类比:10本圣经,都从随机点起始剪成500个字母左右的小纸条,问:给你这么一堆小纸条,你能读出圣经来吗?但是都会拼错!,Shotgun法序列拼接,Consensus,Mis-Assembly(Inverted),拼接错误:Repeat的存在,实例:流感嗜血杆菌基因组的测序及顺序组装,超声波打断纯化的基因组DNA 琼脂糖电泳收集1.62.0Kb的区段、纯化 构建到质粒载体中 随机挑选19687个克隆,进行28643次测序,得到可读顺序为11 631 485 bp 组装成
6、140个覆盖全基因组范围的独立的顺序重叠群,各重叠群间仍有间隙 顺序间隙 物理间隙,载体或宿主菌 选用不当而被丢失的序列,测序时遗漏的测序,解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库,解决办法:利用其它宿主菌与载体重新构建文库,运用计算机软件进行序列拼接,Francis Collins VS.J.Craig Venter,6.基因识别,基因识别(gene identification)是HGP的重要内容之一,其目的是识别全部人类的基因。基因识别包括:识别基因组编码区识别基因结构基因识别目前常采用的有二种方法:从基因组序列中识别转录表达的DNA片段从cDNA文库中挑取并克隆。,7.模
7、式生物的基因组测序,酵母,大肠杆菌,果蝇,线虫,老鼠,水稻基因组测序,水稻是全球半数以上人口的主食,对解决全球粮食问题具有重要意义。2002年我国科学家完成了水稻基因组定序和初步分析。出人意料的是,水稻的基因竟比人类基因还要多得多。人类基因大约有3万多个,水稻有4万多个基因。水稻基因组可说是继人类基因组之后,完成定序的最大基因组,也是至今已知最大的植物基因组。,8.人类基因组计划对医学事业的影响,促进对致病基因的克隆疾病的预测与诊断如果掌握了与某种疾病相关的基因及突变,则可以对该疾病进行预测、诊断。基因疗法的发展与应用通过生物学、医学等技术对疾病相关基因进行抑制或调控,即可达到治疗某一疾病的效
8、果。,基因变异与疾病,第二节 DNA片段组装,大规模基因组测序得到待测序列的一系列序列片段这些序列片段覆盖待测序列序列片段之间也存在着相互覆盖或者重叠。,目标序列序列碎片,(1)碱基标识错误,1.片段组装的4个主要问题,(2)不知道片段的方向,(3)存在重复区域,(4)缺少覆盖(gap),2、序列片段组装过程,序列片段组装过程三个步骤:首先进行序列片段的两两比较,确定可能的片段之间的覆盖(或者重叠);确定所有片段统一的覆盖模式,即确定各个序列片段的相对位置;最后确定片段组装结果,即确定目标序列。,1、基因组DNA的奥秘 遗传信息存贮在4种字符组成的核酸序列中“天书”用遗传语言书写的人类遗传蓝本
9、包含的信息量巨大更重要的是目前人类对它了解甚少天书中只有4个字符(碱基A、T、G、C)既没有段落,也没有标点符号是一个长度为3109的一维序列。,第三节 基因组DNA序列分析,科学家对这本天书了解最多的部分就是遗传密码密码子的特点(1)密码子的使用是非随机的 如果密码子的第一、第二位碱基是A、U,那么第三位将尽可能使用G、C;反之亦然。如果三位都用G、C,则配对容易,分解难;三位都用A、U,则相反。一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分手也快。,(2)密码子的使用有一定的统计规律 对同义密码子的使用存在着偏爱不同种属偏爱的密码子不同 人类基因组:密码子第三位取A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6263073.html