生物信息学Bioinformatics第讲生物信息学研究内容.ppt
《生物信息学Bioinformatics第讲生物信息学研究内容.ppt》由会员分享,可在线阅读,更多相关《生物信息学Bioinformatics第讲生物信息学研究内容.ppt(56页珍藏版)》请在三一办公上搜索。
1、生 物 信 息 学Bioinformatics第2讲 生物信息学研究内容,主讲教师:刘 吉 平2004年3月,生 物 信 息 学,主要介绍的内容:什么是生物信息学?国内外生物信息学的研究历史和现状。生物信息学的研究内容和科学目标。分别解读生物分子的三大核心数据库:GenBank核酸序列数据库、SWISS-PORT 蛋白质序列数据库、PDF生物大分子结构数据库。介绍国内外有关生物信息学的网站和网址。,生物信息学,上找有关生物信息学的网站或网页,Biology,Protein,Phenotype,DNA(Genotype),基因结构,The 4 bases,c,N,N,C,C,C,C,C,C,C,
2、C,C,N,N,N,N,N,H,o,o,H,H,H,H,H,H,H,H,Adenine,Thymine,c,N,N,C,C,C,C,C,C,C,C,N,N,N,N,H,o,H,H,o,N,N,H,H,H,H,H,Guanine,Cytosine,A-T,G-C,Note:this is flat!,Uracil replaces Tin RNA,Purine ring,Pyrimidine ring,三 研究内容,生物信息学与计算生物学或生物计算有着密切的关系,但又不尽相同.目前归入生物信息学研究领域的大致有以下七个方面:,Bioinfomatics七个方面研究内容,建立和管理各种生物数据库生
3、物信息数据库使用生物信息学中的数学模式和算法研究数据库接口和检索工具的研制HGP的实施,对信息采集和处理提出的要求生物信息学最重要的任务,是从大量数据中提取新知识DNA芯片和微阵列的发展,1 建立和管理各种生物数据库,各种生物数据库的建立和管理。如核酸序列数据库、蛋白质数据库、各种专业的数据库等。这是一切生物信息学工作的基础,通常要有计算机科学背景的专业人员与生物学家密切合作。,2、生物信息数据库使用,近些年来随着快速序列测定、基因重组、多维核磁共振等技术的应用,基因组与蛋白质的实验数据呈爆炸性趋势增长;建立数据库再结合有关的分析软件使大规模数据的贮存、处理和分析成为可能,并已发展成为包括基因
4、组信息与蛋白质结构模拟在内的生物信息学研究的重要基础。,核酸序列数据库,Genbank,美国国家生物技术信息中心的数据库()。EMBL,建立在欧洲分子生物实验室的数据库(http:/www.embl-heidelberg.de)。DDBJ,是DNA Data Bank of Japan的简称,又叫日本的DNA数据库银行(available at http:/www.nig.ac.jp)。,Genbank,美国国家生物技术信息中心的数据库原中山医科大学的网页有链接:该数据库提供Entrez检索工具、BLAST序列搜索、生物信息学学习等服务内容,其他重要数据库,真菌如酿酒酵母基因组数据库(SGD)
5、拟南芥数据库(AtDB)(http:/genome-www.stanford.edu/Arabidopsis/)线虫综合数据库(ACEDB)ftp:/sanger.ac.uk(/pub/acedb)(自由下载,建立二次数据库)在线人类孟德尔遗传数据库(Online Mendelian Inheritance in Man,OMIM)/,其他重要生物数据库,鱼类的 斑马鱼 http:/zfin.org/昆虫类的果蝇(Drosophila melanogaster,fruitfly)脊椎动物如小鼠(Mus musculus细菌如大肠杆菌()原生动物如人类一种寄生性的原虫(Plasmodium fa
6、lciparum):http:/PlasmoDB.org/,三维结构数据库,PDB(Protein Data Bank,http:/)等。与蛋白质结构有关的数据库还有:SCOP(available at/)等。,80-99年,Helix-turn-helix motif of protein binding to DNA结合DNA的蛋白质螺旋结构基序,Motif数据库-PROSITE,PROSITE(http:/www.expasy.org/prosite/),蛋白质结构数据,生物信息数据库的主要服务,借助特定的算法模型提供同源性分析是目前各种生物信息数据库的最重要内容之一。,分子生物学的中心
7、法则,DNA,mRNA,结构,翻译,转录,复制,蛋白质/酶,cDNA,DNA,功能,反转录,相互作用,折叠,3、生物信息学中的数学模式和重要算法研究,迄今已有相当多的数学方法应用于生物信息学的研究。而且一种算法本身就是一门学问,例如:机器学习法人工神经网络分形理论密码学全息论高维分布的统计方法,生物信息学中的重要算法-聚类分析,生物信息学问题许多可归为聚类问题。聚类分析:聚类是宏观与微观生物学研究中最常用的一种数学方法,它的基本目的是将n个样本划分为m个类,从而使同类样本较为相似而不同类间样本差异较大。其中支撑矢量机算法可从网上学习:寻找转录因子的结合位点,生物信息学中的重要算法,遗传算法:遗
8、传算法的提出,本身就是借鉴生物界中的适者生存、优胜劣汰的遗传机制所提出来的随机化搜索方法,其最主要的特点就是面向结构对象、不受求导和函数连续性的限定、具有内在的隐并行性和良好的全局寻优能力。,生物信息学中的重要算法-遗传算法,过去20多年的发展,已使得遗传算法成为现代智能计算中的关键技术之一,并已应用于生物信息学的研究:基于蛋白质主链结构的侧链构象计算蛋白质折叠的算法模型与模拟图像匹配中的遗传算法结构图的同态研究,目前较流行的数学方法和算法(1),神经网络(Neural Networks)1982年,神经网络首次被应用到生物学的研究中来,接着Stormo等人应用类似的算法在预测大肠杆菌体内的一
9、些蛋白质翻译的起始部位取得了成功。1988年,随着Qian and Sejnowski发表的一篇关于蛋白质二级结构预测的文章,神经网络的算法已成为蛋白质二级结构分析预测的主流算法。另外,神经网络在预测信号肽,研究遗传密码的结构和起源等方面也有较多应用。,目前较流行的数学方法和算法(2)Threading方法,Threading方法或称折叠类型的识别方法。基本思想是:预测的蛋白的折叠类型与某一已知结构的蛋白的折叠类型相同,这样蛋白质结构预测问题就转变为在已知空间结构的蛋白质中,选取一种最有可能的折叠类型,从而大大减小预测蛋白质结构的难度。,4 数据库接口和检索工具的研制,数据库的内容来自万千生物
10、学者的日积月累,最终又为生物学者们所用。但不能要求一般生物学工作者具有高深的计算机和网络知识,因此,必须发展查询数据库和向库里提供数据的方便接口。这是专业人员才能胜任的工作,通常在生物信息中心里进行。,5 HGP的实施,对信息采集和处理提出的要求,人类基因组计划(HGP)的实施,配合大规模的DNA自动测序,对信息的采集和处理提出了空前的要求。从各种图谱的分析,大量序列片段的拼接组装,寻找基因和预测结构与功能,到数据和研究结果的视像化,无不需要高效率的算法和程序。因此,研究新算法、发展方便适用的程序,是生物信息学的日常任务。,与HGP相关研究的几个方面表现:,由于当前生物信息学发展的主要推动力来
11、自HGP,所以生物信息学与HGP的关系就显得更为密切,其与HGP相关的研究主要表现在如下几个方面:,1)高度自动化的实验数据的获得、加工和整理,如何将实验室中得到的生物学信息转化为计算机能够处理的数字信息,是生物学的一个重要课题。体现在各种自动化分子生物学仪器应用上,如DNA测序仪,PCR仪等。这类仪器将实验所得的物理化学信号转化为数字信息,并对其作简单分析,再将分析结果用于实验条件的控制,完成高度自动化的实验过程。,2)序列片段的拼接,目前DNA自动测序仪每个反应只能测序500bp左右。如何将这些序列片段拼接成完整的DNA顺序就成为接下来 的一个重要工作。传统的测序技术通常将克隆进行亚克隆并
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 Bioinformatics 研究 内容

链接地址:https://www.31ppt.com/p-6316331.html