生物信息学在分子诊断中的应用.ppt
《生物信息学在分子诊断中的应用.ppt》由会员分享,可在线阅读,更多相关《生物信息学在分子诊断中的应用.ppt(74页珍藏版)》请在三一办公上搜索。
1、生物信息学在分子诊断中的应用,第一节 生物信息学概论,生物信息学的定义 生物信息学研究的范畴,第一节 生物信息学概论一、生物信息学的定义,生物信息学是结合了生物学和信息技术,利用计算机和互联网技术,分析海量的并且还在快速积累的生物数据,从中获取生物科学新知识的一门新的交叉科学。,人类基因组计划的意义,人类基因研究的意义在于它可以支持和推动生命科学中一系列重要的基础性研究。如基因组遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、生产、分化的分子机理,疾病发生的机理等。为推动医学长足进步带来前所未有的机遇,基因诊断、基因疗法和基因药物的开发,有可能成为未来医学发展的重要分支。人类
2、基因组计划的进一步成功将促进生命科学与信息科学、材料科学的融合,从而带动一批高技术产业的发展,第一节 生物信息学概论,第一节 生物信息学概论二、生物信息学研究的范畴,第一、各种生物数据库的建立和管理;第二、研究高效率的统计工具,分析算法,发展方便、快捷的分析程序;第三、从海量的原始生物数据中发掘新知识。,第二节 计算机和互联网,计算机常识和互联网常用搜索引擎文件的压缩和解压文件和数据的传送编程和语言,第二节 计算机和互联网一、计算机常识:硬件和软件,计算机的主要硬件由中央处理器(CPU)、存储器、输入设备和输出设备组成。常用的操作系统:windows、UNIX、Linux,第二节 计算机和互联
3、网二、互联网和常用搜索引擎,WWW是World Wide Web的缩写,即通常我们所说的国际互联网,它的每个节点在逻辑上都与任何其他节点保持联系,可以相互交换信息。,第二节 计算机和互联网二、互联网和常用搜索引擎,第二节 计算机和互联网三、文件的压缩和解压,传输或保存较大的数据时,常对文件进行压缩,以减少数据量。特别是对于图形文件,压缩尤其重要。在UNIX或Linux系统中,压缩命令是compress myfile,压缩后的文件自动加上后缀.Z。解压缩命令是uncompress myfile.Z。PC机上的Windows操作系统没有标准的压缩和解压软件,但网上有许多针对Windows的免费或代
4、免费试用期的压缩软件,如FreeZip、WinZip等,第二节 计算机和互联网四、文件和数据的传送,用户需要递交一条或多条核酸或蛋白质序列去做数据库查询或比对。这时常用的方法有:使用视窗系统的剪切、复制和粘贴的功能.对于不太长的序列,这 种方法比较方便;网页的输入窗口旁常有一个“浏览目录”按钮,点击该按钮,会弹 出一个对话框,找到需要上传的序列文件,再按“提交”钮完成递 交。用这种方法可以一次递交较长的序列;有些大型信息中心和研究单位还有远程文件传送服务,即遵从文件 传输协议(file transfer protocol,ftp)的服务器地址,用户可以无记 名的方式访问公用的目录,读取文件,下
5、载软件或数据。,第二节 计算机和互联网五、编程和语言,在众多的计算机语言中,C语言无疑是最常用的,它具有 代码精炼,执行效率高的特点,网上还有大量的现成模块 供免费使用。对于非计算机专业人员,还可以选择Visual BASIC(VB)语言。VB语言具备了高级语言的特点,语句结构类似自然 语言,对于生物背景的专业人员可能较容易掌握。如果在研究中大量使用网络资源,则需要掌握一定的网络 编程语言,例如:Perl语言、PHP语言和JAVA语言等,第三节 数据的获得,DNA、RNA、蛋白质的测序 蛋白质结构的分析 基因和蛋白质的表达数据 蛋白质相互作用,第三节 数据的获得一、DNA、RNA和蛋白质的测序
6、,基因组DNA直接来源于细胞核基因组,它的组成包括 基因和基因间区域,基因序列中还包括内含子和外显子。cDNA是由mRNA逆转录而来,全长cDNA应该包括5端 非编码区,3 端的多聚腺苷酸序列和编码序列。重组DNA序列是基因重组到质粒、病毒和cosmid等载体 后经测序得到的DNA序列。,2009-4-28,2009-4-28,第三节 数据的获得一、DNA、RNA和蛋白质的测序,2009-4-28,第三节 数据的获得一、DNA、RNA和蛋白质的测序,2009-4-28,第三节 数据的获得一、DNA、RNA和蛋白质的测序,RNA的序列可以从基因组序列或cDNA序列推导出来;直接 的RNA测序涉及
7、修饰核苷酸的识别,可通过质谱分析获得。蛋白质的序列可以通过DNA序列推导而来,但从DNA序列 推导的蛋白质序列不能反应真实的蛋白质序列情况,蛋白质 测序主要依靠质谱分析(mass spectrometry,MS)技术,基本原 理是通过准确测定真空中的离子质量或电荷量来测算出分 子组成。,2009-4-28,第三节 数据的获得二、蛋白结构的分析,X射线晶体学技术:通过研究X射线对蛋白质晶体的扫描后产生的衍射模式来测定蛋白质的结构;核磁共振谱法(NMR)spectroscopy):该方法常用于较小(25kDa)的,可溶性蛋白质结构的测定;有些蛋白质很难结晶,不能用X射线晶体学技术测定,又太大而不能
8、用核磁共振谱技术测定,其它技术方法:X射线纤维衍射技术;电子显微镜(electron microscopy);环形双色色谱技术(circular dichroism(CD)spectroscopy),2009-4-28,第三节 数据的获得三、基因和蛋白质表达数据,表达文库的测序 基因表达连续分析技术(serial analysis of gene expression,SAGE)DNA芯片 双向电泳分析技术(2D gel electrophoresis),2009-4-28,基因表达连续分析技术原理,第三节 数据的获得三、基因和蛋白质表达数据,双向电泳分析技术原理:1个方向是SDS-聚丙烯酰胺
9、凝胶 主要是把蛋白质按照 分子量分开;1个方向是等点聚焦 把蛋白质按照等电点的不同分开,这样就可以把不同的蛋白质尽可能的分开。,2009-4-28,第三节 数据的获得四、蛋白质相互作用,1、遗传学方法:2、亲和性方法:亲和色谱法(Affinity chromatography)免疫共沉淀法(coimmunoprecipitation)免疫共沉淀基本原理:细胞裂解液中加入抗体,与抗原形成特异免疫复合物,经过洗脱,收集免疫复合物,然后进行SDS-PAGE及 Western blotting分析。,2009-4-28,3、分子和原子法:X射线晶体法和核磁共振法 4、基于文库法:酵母双杂交系统(yea
10、st two-hybrid(Y2H)system),第三节 数据的获得四、蛋白质相互作用,酵母双杂交系统的建立得力于对真核细胞调控转录起始过程的认识。研究发现,许多真核生物的转录激活因子都是由两个可以分开的、功能上相互独立的结构域(domain)组成的。例如,酵母的转录激活因子GAL4,在N端有一个由147个氨基酸组成的DNA结合域(DNA binding domain,BD),C端有一个由113个氨基酸组成的转录激活域(transcription activation domain,AD)。当GAL4分子的DNA结合域和上游激活序列(upstream activating sequence,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 分子 诊断 中的 应用
链接地址:https://www.31ppt.com/p-6001802.html