基因工程 绪论课件.ppt
《基因工程 绪论课件.ppt》由会员分享,可在线阅读,更多相关《基因工程 绪论课件.ppt(85页珍藏版)》请在三一办公上搜索。
1、生 物 信 息 学Bioinformatics,海南大学 农学院生物技术系杨诺2010年2月,参考文献,1、生物信息学概论 罗静初 北京大学 北京大学出版社2、生物信息学(863高科技丛书) 赵国平 中科院上海生命科学院 科学出版社3、生物信息学基因和蛋白质分析的使用指南 李衍达 清华大学 清华大学出版社4、生物信息学手册 郝柏林 中科院物理所 上海科学技术出版社5、简明生物信息学 钟扬 复旦大学 高等教育出版社6、生物信息学札记(第三版)(http:/ 樊龙江 浙江大学,第一章 生物信息学通论,第一节 生物信息与生物信息学第二节 生物信息学发展简史第三节 人类基因组计划和基因组信息学第四节
2、基因组时代:生物信息学的应用与展望,生命信息的组织、传递、表达,物理,化学,分子生物学,遗传学,信息技术,第一节 生物信息与生物信息学,一、迅速膨胀的生物信息,近20年来,分子生物学发展的一个显著特点是生物信息的剧烈膨胀,且迅速形成了巨量的生物信息库。这里所指的生物信息包括多种数据类型,如分子序列(核酸和蛋白质),蛋白质二级结构和三维结构数据、蛋白质疏水性数据等等。由实验获得的大量核酸序列和三维结构数据被存在数据库中,这些数据库就是所谓的初级数据库(primary databases);那些由原始数据分析而来的诸如二级结构、疏水位点和功能区(domain)数据,则组成了所谓的二级数据(seco
3、ndary databases)。那些由核酸数据库序列翻译而来的蛋白质序列数据组成的蛋白质数据库,也应被视为二级数据库。,生物信息的增长是惊人的。近年来,核酸库的数据每10个月左右就要翻一翻,2000年底,数据库数据则达到了创记录的100亿个记录,大量生物(甚至包括我们人类自身)的整个基因组序列被测定完成或正在进行中,遍布世界各地研究实验室的高通量大型测序仪在日夜不停地运转,每天都有成千上万的数据被源源不断地输入相应的生物信息库中。同时,由这些原始数据分析加工而来的蛋白质结构等数据信息也被世界各地的分子生物学、生物信息学等学科领域专家输入二级数据库中。图1.1显示出了各种生物信息的同步增长状况
4、。 迅速膨胀的生物信息给科学家们提出了一个新问题:如何有效管理、准确解读、充分使用这些信息?,图1.1各类生物信息的同步增长状况。图中依次为核酸序(GenBank)、蛋白质序(PDB)、蛋白质序列(SWISS-PROT)和文献数量增长幅度(引自NCBI,2000)。,二、生物信息学的概念,生物信息学便是在生物信息的急剧膨胀的压力下诞生了。 一般意义上,生物信息学是研究生物信息的采集、处理、存储、传播、分析和解释等各方面的一门学科,它通过综合利用生物学、计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。 具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为
5、源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学、蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。,从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。 Claverie (2000)的一段英文描述如下:“Bioinformatics is the science of using information to understand biology. Its the discipline of obta
6、ining information about genomic or protein sequence data. This may involve similarity searches of databases, comparing your unidentified sequence to the sequences in a database, or making predictions about the sequence based on current knowledge of similar sequences.”,Bioinformatics,生物信息学最初更多地是关注数据库
7、,那些数据库存储着来自基因组测序计划完成的序列数据。目前生物信息学已今非昔比,它所关注的是各类数据,包括生物大分子的三维结构、代谢途径和基因表达等等。生物信息学最使人们感兴趣的是它利用计算方法分析生物数据,如根据核酸序列预测蛋白质序列、结构、功能的算法等。虽然这些预测还不是非常精准,但是当可靠的实验数据还无法得到的情况下,这这一预测可以作为一盏路灯,指示你应如何开展实验。,图1-2 生物信息学“路线图”。取自http:/www.kisac.ki.se/。,生物信息学主要研究两种信息载体DNA分子蛋白质分子,生物信息学的诞生和发展最早可以追溯到上个世纪的60年代,波林(Pauling)分子进化理
8、论的出现,已预示着生物信息学的来临。而真正意义上的“生物信息学(Bioinformatics)”一词的出现则是1990年(见:“A term coined in 1990 to define the use of computers in sequence analysis” (Claverie, 2000),据说是由出生在马来西亚的美籍学者林华安(Hwa A. Lim)首次使用的(郝柏林和张淑誉,2002)。,虽然生物信息学的历史并不长,但正象生物信息的迅猛发展一样,生物信息学已发展了大量独具学科特色的分析方法和分析软件。例如,当获得了大量序列数据以后,我们现在已能进行序列家族或同源性分析;
9、进行序列的聚类,建立进化树并确定序列间的进化关系;进行代谢途径相关基因的同源性分析,以及获取其它生物代谢途径的相关信息等。分析软件更是层出不穷,通过网络可以搜索到大量的相关信息。这些软件很多已成为商业化产品,但很多软件是可以免费获取的。这些分析软件已成为生物信息学最重要的研究手段,是生物学家获取信息的重要途径和生物信息学显示其价值的窗口。,生物信息学还有另一个经常被使用的名字:“计算生物学”(computational biology),此外“计算分子生物学”(computational molecular biology)和“生物分子信息学”(biomolecular informatics
10、)等也被使用过。但严格意义上说,计算生物学的范围应更宽泛些见“Strictly speaking, bioinformatics is a subset of the large field of computational biology, the application of quantitative analytical techniques in modeling biological system.” (Gibas and Jambeck, 2001)。,正确认识和理解生物信息学这门新学科非常重要,它有助于该学科的科学研究和学习。Bioinformatics杂志的一篇社论文章(200
11、0,vol 16 no.3,其翻译稿见庞洪泉和樊龙江,生物技术通报,2002,2:47-52),评析了人们对生物信息学的一些不正确的认识: (1)“人人可以从事生物信息学研究”。这一认识的根源来自对生物信息学的2个误解,一是生物信息学研究不需大量经费投入,因为有如此多的数据资源,只要找本生物学教科书,有台电脑并连到国际网上,人人可以从事生物信息学研究;二是生物信息学的软件是免费的。殊不知生物信息的巨量特征目前向计算机提出了严峻的考验,而一台大型新型计算机可能要以千万甚至亿元计算,同时大量先进、最新的生物信息学分析软件包都是商业化产品,不付钱难以到;,(2)“你最终还是需要具体的实验”。实验生物
12、学家非常羡慕生物信息学家,认为“他们只是敲敲键盘,然后便是写论文”,他们的研究结果只是一种试验结果的预测,是对实验研究的一种“支持”。在分子生物学研究中,固定的模式应是先有某一假设,然后用某一实验去验证或支持这一最初的猜测。在生物信息学研究中,也同样进行着这一模式:有一无效假设(例如某一序列在数据库中没有同源序列),然后进行实验(如搜索数据库)并验证,拒绝或接受无效假设(如该序列的确有或无同源序列)。这是一个标准的假设实验模式。在其它学科中,计算科学已被作为深入理解科学问题的重要手段,而在生物学领域还没有形成这样的共识;,(3)“生物信息学是门新技术,但只是一门技术而已”。由此把生物信息学定位
13、为一门新的应用学科。正如前面所说,虽然生物信息学是一门新学科,但在60-70年代,该学科最重要的一些算法便已被提出,生物计算和理论研究便形成雏形。把生物信息学仅仅作为一门应用技术,是从信息学移植来的技术应用于生物学科领域,这是一个致命的误解。生物信息学实际是一门充满丰富知识内涵的学科,它有很多尚待解决的科学问题。这些问题包括生物学方面的(如分子的功能如何进化)和计算方面的(如数据库系统间如何最有效地协同)。生物信息学不仅仅是一个技术平台,它同样需要周详的实验计划和准确的操作,同样需要丰富的想象和一瞬即逝的运气。,三、生物信息学的目标和任务,收集和管理生物分子数据数据分析和挖掘开发分析工具和实用
14、软件生物分子序列比较工具基因识别工具生物分子结构预测工具基因表达数据分析工具,生物分子信息处理流程,四、生物信息学的研究意义,认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。改变生物学的研究方式 改变传统研究方式,引进现代信息学方法在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据,第二节 生物信息学发展简史,生物信息学基本思想的产生,生物信息学 的迅速发展,二十世纪50年代,二十世纪80-90年代,生物科学和技术的发展,人类基因组计划的推动,1962 Pauling提出分子进化理论 1967 Dayhoff构建蛋白质序列数据库 1970 Need
15、leman-Wunsch算法被提出 1977 Staden利用计算机软件分析DNA序列 1981 Smith-Waterman算法出现 1981 序列模序(motif)的概念被提出(Doolittle) 1982 GenBank数据库(Release3)公开;EMBL创立 1982 -噬菌体基因组被测序 1983 Wilbur和Lipman提出序列数据库的搜索算法 (Wilber-Lipman算法),1985 快速序列相似性搜索程度FASTP/FASTN发布 1988 美国家生物技术信息中心(NCBI)创立 1988 欧洲分子生物学网络EMBnet创立;三大核酸数据库 (GenBank、EMB
16、L和DDBJ)开始国际合作1990 快速序列相似性搜索程序BLAST发布 1991 表达序列标签(EST)概念被提出,从此开创EST测序 1993 英国Sanger中心在英国休斯顿建立 1994 欧洲生物信息学研究所在英国Hinxton成立,1995 第一个细菌基因组测序完成 1996 酶母基因组测序完成 1997 PSI-BLAST(BLAST系列程序之一)发布 1998 PhilGreen等人研制的自动测序组装系统Phred- Phrap-Consed系统正式发布 1998 多细胞线虫基因组测序完成 1999 果蝇基因组测序完成 2000 人类基因组测序基本完成 2001 人类基因组初步分
17、析结果公布,http:/www.ncbi.nlm.nih.gov/Education/BLASTinfo/milestones.html,以上这些事件大多是在“生物信息学”(bioinformatics)一词出现前便发生了。纵观生物信息学的发展历史,可将它分为3个主要阶段: (1)萌芽期(60-70年代):以Dayhoff的替换矩阵Neelleman-Wunsch算法为代表,它们实际组成了生物信息学的一个最基本的内容和思路:序列比较。它们的出现,代表了生物信息学的诞生(虽然“生物信息学”一词很晚才出现),以后的发展基本是在这2项内容上不断改善;,(2)形成期(80年代):以分子数据库和BLAS
18、T等相似性搜索程序为代表。1982年三大分子数据库的国际合作使数据共享成为可能,同时为了有效管理与日俱增的数据,以BLAST、FASTA等为代表工具软件和相应的新算法大量被提出和研制,极大地改善了人类管理和利用分子数据的能力。在这一阶段,生物信息学作为一个新兴学科已经形成,并确立了自身学科的特征和地位;,(3)高速发展期(90年代-至今):以基因组测序与分析为代表。基因组计划,特别是人类基因组计划的实施,分子数据以亿计;基因组水平上的分析使生物信息学的优势得以充分表现,基因组信息学成为生物信息学中发展最快的学科前沿。Phred-Phrap-Consed系统软件包自1993年出现,1995年已广
19、泛应用于鸟枪法测序中序列的碱基识别、拼装和编辑等,是目前人类基因组等测序计划的主要应用软件,与BLAST一起在人类基因组计划的研究历史中占有一席之地(见Science 2001年2月16日人类基因组专刊“A history of Human Genome Project”一文)。,在此阶段,生物信息学已成为举世瞻目、竞相发展的热点学科。GenBank等数据库中数据的增长在近十年来呈直线上升趋势,这条曲线很容易就使我们联想到生物信息学的发展历程,可以说,这条曲线便是生物信息学近十余年发展的写照。生物信息学在近十余年间经历了长足的发展,并迅速成为生命科学新的生长点。人类基因组计划的实施和生物医药工
20、业的介入是生物信息学迅猛发展的主要推动力。,英国剑桥大学出版社出版的Bioinformatics期刊(www.bioinformatics.oupjournal.org)是目前世界最知名生物信息学的学术期刊之一,它的前身是Computer Applications in the Bioscience(CABIOS),1998年更名为Bioinformatics。该杂志主要发表计算分子生物学、生物数据库和基因组生物信息学方面的文章。,另外带有生物信息学字样的杂志还有Applied Bioinformatics、Briefings in Bioinformatics、Journal of bioi
21、nformatics and computational biology、Genomics, proteomics & bioinformatics、Proceedings / IEEE Computer Society Bioinformatics Conference以及网上生物信息学杂志BMC Bioinformatics()等。其它与生物信息学相关的出版物还很多,如Nucleic Acids Research、Genome Research、Genomics、J. Mol. Biol.、BioTechniques、BioTechnology Software等。,美国家生物技术信息中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因工程 绪论课件 绪论 课件

链接地址:https://www.31ppt.com/p-1487334.html