欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第一课生物信息学概论课件.ppt

    • 资源ID:1525838       资源大小:2.76MB        全文页数:52页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第一课生物信息学概论课件.ppt

    生 物 信 息 学 概 论Introduction to Bioinformatics,程钢生命科学学院中南民族大学,一、生物信息学发展的背景二、生物信息学概念及其研究内容和特点三、生物信息学的发展现状四、生物信息学课程的特点,一、生物信息学发展的背景,(1)基因组测序计划 海量DNA序列数据,DNA序列是生命的真谛,这个世界上发生的一切事情都与这一序列息息相关。(唯DNA论)人类基因组计划(HGP)1990年启动目标:测定人类基因组的全部DNA序 列, 了解基因及其功能国际大合作:美国、英国、日本、 法国、德国、中国投入:30亿美元结果:2003年完成精细图,产生28亿多个数据(碱基),AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATA,A C G T,相当于2800多本每本1000页每页1000字的“天书”,基因组测序计划 海量DNA序列数据(续),模式生物基因组计划模式生物:小鼠、线虫、拟南芥、果蝇、水稻、酵母、 古细菌、真细菌、病毒 地球生物圈约有140万余种物种, 其中2以上至少有一段DNA序 列被测定。 真核生物 12500 种 哺乳动物 4200 种 真 细 菌 3600 种 古 细 菌 180 种 病 毒 1750 种,DNA序列数据增长趋势,功能基因组研究 功能相关海量数据,转录组EST (Expressed Sequence Tag)DNA Microarray large scale gene expression analysis蛋白质组2D Gel Electrophoresis protein expression analysisMass Spectrometry protein sequencingYeast Two-Hybrid (Y2H) System protein interaction analysis结构基因组X-ray CrystallographyNMR (Nuclear Magnetic Resonance) Spectroscopy,The Yeast cDNA Microarray Picture,基因表达谱数据增长趋势,The number of entries in SwissProt 140,000 now!,蛋白质序列数据增长情况,Tertiary Structure of a Protein,蛋白质结构数据增长情况,各种分子生物学数据库及其增长情况,生物数据爆炸性增长:得到的结论是:生物数据量的积累已达到人类有史以来所记录的文字的数百倍,而且还将以越来越快的速度增长。,16,(2)更为本质的原因是生物学数据的复杂性急待生物信息学的分析方法。,多基因病中致病基因彼此关系和致病性分析。蛋白三维结构和基于结构预测的蛋白之间或者蛋白与药物分子的相互作用和蛋白亚细胞定位。,17,生物信息学是今后所有从事现代生物学(医药学)研究所必需的工具和相关工作人员需要具备的基本技能。,二、生物信息学概念及其研究内容和特点,生物数据爆炸性增长所带来的挑战,AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAA,A C G T,海量数据的存储、管理、共享数据 知识,如何将这些数据变为生物学知识?,20,生物信息学基本概念,早在1956年,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会”上,便产生了生物信息学的概念。1987年,林华安博士正式把这一学科命名为“生物信息学”(Bioinformatics)。被尊称为“生物信息学之父”。生物信息学(Bioinformatics):(1)生物信息学包含了生物信息的获取、处理、储存、分析和解释等在内一门交叉学科,(2)它综合运用数学、计算机科学和生物学的各种工具进行研究,(3)目的在于阐明大量生物学数据所包含的生物学意义。,21,生物信息学当前的主要研究任务,生物数据的收集与服务基因组分析(核酸序列分析)转录组数据分析(基因表达分析)蛋白质组数据分析(七大方面)代谢组数据分析(生化网络以及多数据资源的整合分 析)疾病基因预测(相关数据资源的整合分析)药物靶点发现与药物设计(相关数据资源的整合分析)生物信息分析的技术和方法研究,22,生物信息学当前的主要研究任务,生物数据的收集与服务基因组分析(核酸序列分析)核苷酸多态性的研究是以发现和分析群体(包括相近亚种间)DNA顺序上的差别为基础,揭示这些多态性与基因表达和基因功能的关系,基因型和表现型的内在联系。为我们绘制人类基因组单倍体图和以后绘制其他物种的遗传图谱奠定基础。,23,生物数据的收集与服务基因组分析(核酸序列分析)转录组数据分析(基因表达分析)RNA水平基因表达研究的基本方法有EST、Micro-array,所产生的数据量也非常巨大。但是目前的分析方法和手段都有很多潜力可以挖掘,尤其是数学模型的建立,与基因组数据的整合,对数据真实性的评估等。,生物信息学当前的主要研究任务,24,蛋白质组学: (1)蛋白质组图像数据处理,蛋白及其修饰鉴定(2)构建蛋白质数据库,相关软件的开发和应用;(3)蛋白质结构、功能预测;(4)蛋白质连锁图。,生物信息学当前的主要研究任务,25,代谢组学:新陈代谢是由错综复杂的生化代谢途径所构成的动态网络组成。要揭示代谢的本质是一个长期的目标。但是,我们可以从现有数据出发建立主要或特定代谢途径的模型,如影响人类健康的常见代谢疾病等。,生物信息学当前的主要研究任务,26,生物信息学研究都有其特定的、不断创新的方法学。以系统优化、软件并行化和数据处理技术为主体的海量生物学数据处理体系的建立将基于新的思路和设想。,生物信息学当前的主要研究任务,27,生物信息学的特点,它是一门基于数据积累,尤其是原始数据积累的科学。数据的获取是生物信息学发展的保障和本源。生物信息学研究首先也是基于实验数据的生产、管理和分析。因此,生物信息领域的首要特点是生物学基本数据收集的规模化,数据处理的程序化,数据分析的专门化。,28,生物信息学的特点,极强的竞争性。不仅科研对失败者来说是无情的,而且用户对失败者也是不同情的。被遗弃的算法、工具和不完整的数据库比比皆是。,29,生物信息学的特点,硬件:中高端的服务器和海量数据存储以及个人电脑互联网软件包括了两大方面:算法良好的用户界面,生物信息学研究的意义,科学意义:可望从海量生物学数据分析中获得对生命运行机制和疾病机理等等的深入理解。应用价值:在生物医药研究和生物技术相关产业(生物制药、农、林、牧、渔、环保等)的发展中将发挥越来越重要的作用。,生物信息学研究的意义,产业潜力:自身产业发展潜力很大:1997年1.5亿美元,1998年2.7亿美元, 1999年4.6亿美元,2000年已达7.4亿美元;预测2010年将达千亿美元。竞争优势:强调的是人才智力,是我国赶超世界发达国家最有希望的领域之一,是我国重点支持的方向之一。,三、生物信息学的发展现状,33,生物信息学的发展过程,大致经历了3个阶段:前基因组时代-生物数据库的建立、检索工具的开发、DNA和蛋白质序列分析、全局和局部的序列对位排列;,34,1956年在美国召开过首次“生物学中的信息理论”讨论会 60年代美国建立了手工搜集数据的蛋白质数据库 1962年Zuckerkandl基于序列变异分析的分子演化研究 1964年Davies开创了蛋白质结构预测的研究 1970年Needleman等发表了广受重视的两序列比较算法 1970年出现Computer Methods and Programs in Biomedicine期刊 1974年Ratner首先对分子遗传调控系统进行处理分析 1975年Pipas等首先提出用计算机技术预测RNA二级结构 1979年美国洛斯阿拉莫斯国家实验室建立GenBank Science于1980年发表了关于计算分子生物学的综述 1982年欧洲分子生物学实验室提供EMBL服务 1984年日本着手建立国家级核酸序列数据库DDBJ,35,基因组时代-基因寻找和识别、网络数据库系统的建立、交互界面的开发;,美国于1988年成立国家生物技术信息中心(NCBI)欧洲于1993年着手建立欧洲生物信息学研究所(EBI)日本于1995年组建了自己的信息生物学中心(CIB)九十年代以来,生物数据分析技术获得了突飞猛进的发展。同时在国内北京大学于1997年成立了生物信息学中心上海生命科学研究院于2000年成立了生物信息学中心上海市于2002年成立生物信息技术工程研究中心,36,后基因组时代-大规模不同来源的组学数据分析。,各种专业研究机构和公司如雨后春笋般涌现生物科技公司和制药工业内部生物信息学部门的数量与日俱增即使象美国这样的发达国家也面临生物信息人才匮乏的局面许多大学和研究机构已经成立自己的生物信息学中心生物信息专业期刊越来越多:如 Bioinformatics Journal of Computational Biology Briefings in Bioinformatics Acta Biotheoretica Bio Informatics Technology & Systems Bioinform Newsletter 互联网上的生物信息学网点非常繁多,37,Published April 25, 20082007 IF 4.914作者:魏丽萍 博士北京大学生命科学学院生物信息中心主任,教授蛋白质工程与植物基因工程国家重点实验室 副主任于 军 博士中国科学院北京基因组研究所副所长,38,bioinformatics training programs in China.,31个博士,硕士学位点,39,从工具的角度来讲,生物信息学是今后所有生物(医药)研究开发所必需的方法和相关工作人员需要具备的基本技能,所以生物信息学课程的建设对于生物相关专业有重要的实际意义。,四、“生物信息学”课程的特点,如何掌握好“生物信息学”?,生物、计算机、数学等多学科交叉,知识覆盖面广;涉及从基因组序列分析直到药物设计等众多内容,且应用领域宽广;生物信息数据资源与分析工具繁多,实践环节非常重要;理论方法尚不系统成熟,处于迅速发展变化阶段,知识更新快。缺乏合适的教材,课程特点,数学方面,统计学,是生物信息学的数学基础之一;概率论与随机过程理论;运筹学,如动态规划法;最优化理论与算法;几何拓扑学;函数论,如傅里叶变换,小波变换;信息论,神经网络,计算数学;群论,组合数学等。,计算机方面,网络技术和数据库(特别是关系型数据库)管理技术;数据整合和可视化;数据挖掘(Data Mining)与人工智能;算法设计 ;软件研制。,45,本课程基本要求,硬件:中高端的服务器和海量数据存储以及个人电脑(电脑的熟练使用)互联网(熟练的使用)软件包括了两大方面:算法(基本了解)良好的用户界面(熟练的使用),46,本课程高级要求,了解问题掌握方法熟悉资源融会贯通,了解问题,核酸序列分析分子进化与系统发育分析蛋白质结构预测(蛋白质序列分析)基因功能预测(蛋白质序列分析、基因表达数据分析、蛋白质组数据分析、核酸序列分析 )高阶系统的建模与仿真(众多数据资源的整合分析)疾病基因预测(相关数据资源的整合分析)药物靶点发现与药物设计(相关数据资源的整合分析)其它方面的应用研究(相关数据资源的整合分析),掌握方法,数据挖掘与知识发现方法:贝叶斯方法判别分析决策树特征的选择与提取聚类方法HMM (Hidden Markov Model)方法ANN (Artificial Neural Network)方法SVM (Support Vector Machine)方法数据库与软件的设计与开发,熟悉资源,数据资源分子生物学数据库数量众多(500种以上)、种类繁多基因组数据库、核酸序列数据库、蛋白质序列数据库生物大分子三维空间结构数据库特殊功能数据库、工具数据库分析软件资源核酸序列分析; 蛋白质序列分析; 其它资源搜索引擎; 电子论坛; ,参考书目,生物信息学概论Introduction to bioinformatics (英) T K Attwood , D J Parry-Smith 著 罗静初 等译北京大学出版社 2002年4月第一版生物信息学手册 郝柏林 张淑誉 编著上海科学技术出版社 2000年10月第一版生物信息学 赵国屏 等 编著 科学出版社 2002年4月 第一版 生物信息学-基因和蛋白质分析的实用指南 Bioinformatics-A Practical Guide to the Analysis of Genes and Proteins Andreas D.Baxevanis B.F.Francis Ouellette 著李衍达 孙之荣 等 译清华大学出版社 2000年8月 第一版,51,思考题,生物信息学的定义,联系方式:电话: 65201076 (O:8号楼213#) Email: cheng_,

    注意事项

    本文(第一课生物信息学概论课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开