第6章生物信息学在蛋白质工程中的应用.ppt

资源ID：2938466 资源大小：3.56MB 全文页数：47页
资源格式： PPT 下载积分：8金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要8金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

第6章生物信息学在蛋白质工程中的应用.ppt

蛋白质工程主讲教师：曹运长博士、副教授马云副教授佘美华博士、副教授授课专业：生物技术、生物科学,Protein Engineering,南华大学生化与分子生物学教研室办公室：第3教学楼315室版权声明：本课件版权所有，未经允许不得转载他处。,第六章生物信息学在蛋白质工程中的应用,第一节、生物信息学与蛋白质工程第二节、蛋白质常用数据库第三节、蛋白质结构预测,二十一世纪是生命科学的时代，也是信息时代。近年来，随着现代分子生物学的发展，特别是人类基组计划的实施，不断产生出巨量的分子生物学数据，这些数据有着数量巨大、关系复杂，以至于不利用计算机根本无法实现数据的存储和分析。这样，生物信息学最终形成一门独立的学科并被推上了生物科学发展的最前沿。,前言,第一节生物信息学与蛋白质工程,一、生物信息学概述,定义：它是一个学科领域，包含着对生物信息的获取、加工、存储、分配、分析和解释的所有方面，并综合应用数学、计算机科学、物理学、化学和生物学等工具，来阐明和理解大量生物数据所包含的生物学意义。,（一）生物信息学发展简史,基因组时代：主要是基因的寻找、数据与数据之间的比较、网络相互界面（Interface）；,生物信息学自诞生以来，经历了三个阶段：,前基因组时代：主要是序列分析、数据库的查询、计算机操作和PC的应用；,后基因组时代：主要是数据的挖掘、表达、数据多样性的分析、相互交叉数据分布的总结与分析。其研究的内容不仅包括基因的查寻和同源性分析；而且进一步到基因和基因组的功能分析，即所谓的功能基因组学研究。,生物信息学的诞生,（二）生物信息学的主要研究内容,生物信息的收集、存储、管理与提供,基因组序列信息的提取和分析,功能基因组相关信息分析,生物大分子结构模拟和药物设计,生物信息分析的技术与方法研究,蛋白质组学和结构基因组学,高通量药物筛选,药物设计和小分子设计,创新药物和新剂型,生物芯片,计算机辅助药物筛选高通量虚拟筛选方法,分子数据库，组合化学化合物库,靶标生物大分子的功能分析.,蛋白质蛋白质相互作用识别，信号传导系统、代谢途径的分子模拟.,图像处理、聚类分析、表达谱和调控网络分析.,基因组信息,生物信息技术,计算机辅助先导化合物设计、药物设计,生物信息学的内容,1.生物信息的收集、存储、管理与提供,包括建立国际基本生物信息库和生物信息传输的国际联网系统；建立生物信息数据质量的评估与检测系统；生物信息的在线服务；生物信息可视化和专家系统。,基因组数据库,蛋白质序列数据库,蛋白质结构数据库,DDBJ,EMBL,GenBank,SWISS-PROT,PDB,PIR,生物分子数据的收集与管理,2.基因组序列信息的提取和分析,基因的发现与鉴定；基因组中非编码区的信息结构分析，提出理论模型，阐明该区域的重要生物学功能；进行模式生物完整基因组的信息结构分析和比较研究；利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。,数据库搜索及序列比较,搜索同源序列在一定程度上就是通过序列比较寻找相似序列。序列比较的一个基本操作就是比对，即将两个序列的各个字符（代表核苷酸或者氨基酸残基）按照对应等同或者置换关系进行对比排列，其结果是两个序列共有的排列顺序，这是序列相似程度的一种定性描述。,发现同源分子,下面介绍序列分析的一些基本知识。值得注意的是，在对序列进行分析时，首先应当明确序列的性质,是mRNA序列还是基因组序列？是计算机拼接得到还是经过PCR扩增测序得到？是原核生物还是真核生物？这些决定了分析方法的选择和分析结果的解释。,序列分析,核酸,蛋白质,双序列比对,多序列比对和进化树,ORF(Open Reading Frame)分析,染色体定位,基因结构分析,基因上游调控区分析,跨膜区预测,信号肽预测,亚细胞定位预测,核酸序列分析双序列比对（pairwise alignment）双序列比对是指用计算机进行序列分析的强大工具，比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置。FASTA（http:/www.ebi.ac.uk/fasta33/）和BLAST（http:/www.ncbi.nlm.nih.gov/BLAST/）是目前运用较为广泛的相似性搜索工具。一般输入所比较的序列即可。,3.功能基因组相关信息分析,包括与大规模基因表达谱分析相关的算法、软件研究，基因表达调控网络的研究；与基因组信息相关的核酸、蛋白质空间结构的预测和模拟，以及蛋白质功能预测的研究。,4.生物大分子结构模拟和药物设计,包括RNA(核糖核酸)的结构模拟和反义RNA的分子设计；蛋白质空间结构模拟和分子设计；生物活性分子的电子结构计算和设计；纳米生物材料的模拟与设计；基于酶和功能蛋白质结构、细胞表面受体结构的药物设计；基于DNA结构的药物设计等。,5.生物信息分析的技术与方法研究,包括发展有效的能支持大尺度作图与测序需要的软件、数据库以及若干数据库工具；改进现有的理论分析方法；创建一切适用于基因组信息分析的新方法、新技术；建立严格的多序列比较方法；发展与应用密码学方法以及其他算法和分析技术，用于解释基因组的信息，探索DNA序列及其空间结构信息的新表征；发展研究基因组完整信息结构和信息网络的研究方法等；发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。,生物信息学常用的方法和技术,1.数学统计方法2.动态规划方法3.模式识别技术4.数据库技术5.人工神经网络技术6.分子模型化技术7.分子力学和量子力学计算8.分子动力学模拟9.专家系统 10.Internet技术,（三）生物信息学研究现状与展望,1.国外生物信息学研究现状2.我国生物信息学研究现状3.生物信息学研究目标,国外生物信息学研究现状,各国政府和工业界对生物信息学极为重视，投入了大量资金。欧美各国及日本相继成立了生物信息中心，如美国的国家生物技术信息中心（NCBI）、欧洲生物信息学研究所(EBI)、日本信息生物学中心（CIB）等。NCBI、EBI和CIB相互合作，共同维护着GenBank、EMBL、DDBJ三大基因序列数据库。它们每天通过计算机网络互相交换数据，使得三个数据库能同时获得最新数据。此外，他们每年召开两个年会讨论合作事宜。,我国生物信息学研究现状,在我国，生物信息学随着人类基因组研究的展开才刚刚起步，但已显露出蓬勃发展的势头。在政府的支持和科学家的呼吁下，国家级生物医学信息学中心正在筹建之中。各地政府也给予了足够重视，北京市已经成立了北京生物工程学会生物信息学专业委员会（即北方生物信息学研究会），目的在于联合北方地区从事生物信息学的专家，加强合作，促进学科的发展，并为政府决策提供参考意见。,国内的一些科研单位,清华大学在基因调控及基因功能分析、蛋白质二级结构预测方面、天津大学物理系和中科院理论物理所在相关算法方面、中科院生物物理所在基因组大规模测序数据的组装和标识方面、北京大学化学学院物理化学研究所在蛋白质分子设计方面、华大基因组研究中心（中科院遗传所人类基因组研究中心）在大规模测序数据处理自动化流程体系及数据库系统建立方面均已展开相关研究。北京大学已建立了EMBL中国镜像数据库，将该数据库移植到中国本地，并提供部分的检索服务http：/www.I,生物信息学研究目标,生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是当今乃至下一世纪自然科学和技术科学领域中“基因组”、“信息结构”和“复杂性”这三个重大科学问题的有机结合。,二、生物信息学与蛋白质工程,1.蛋白质序列分析2.蛋白质结构预测3.蛋白质功能预测4.蛋白质分子设计,蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定，蛋白质结构预测成为了解蛋白质功能的重要途径蛋白质结构预测分为:二级结构预测空间结构预测,蛋白质折叠,二级结构预测,在一定程度上二级结构的预测可以归结为模式识别问题在二级结构预测方面主要方法有：立体化学方法图论方法统计方法最邻近决策方法基于规则的专家系统方法分子动力学方法人工神经网络方法预测准确率超过70%的第一个软件是基于神经网络的PHD系统,空间结构预测,在空间结构预测方面，比较成功的理论方法是同源模型法该方法的依据是：相似序列的蛋白质倾向于折叠成相似的三维空间结构运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作,第二节蛋白质常用数据库,按照来源分类：,生物信息学数据库,一次数据库：数据直接来源于实验获得的原始数据，仅对原始数据进行简单的归类整理和注释。,二次数据库：在一次数据库、实验数据和理论分析的基础上对相关生物学知识和信息进行进一步分析和整理。,一、核酸数据库,（一）核酸序列数据库主要有GenBank、EMBL、DDBJ.,1.GenBank http:/www.ncbi.nlm.nih.gov,GenBank数据库是由美国国立生物技术信息中心（NCBI）维护的一级核酸序列数据库。,GenBank数据库的数据来源有三种：1)直接来源于测序工作者提交的序列；2)与其它数据机构协作交换的数据；3)美国专利局提供的专利数据。,Nucleotide 数据库分为三个子数据库：,EST:表达序列标记数据库GSS:基因组测序序列数据库CoreNucleotide:包含所有未被以上两个子数据库收录的核苷酸序列,ras,rasGENE,GenBank格式,2.EMBL核酸序列数据库 http:/www.ebi.ac.uk/embl/,由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成，由于与Genbank和DDBJ的数据合作交换，它也是一个全面的核酸序列数据库。,3.DDBJ核酸序列数据库 http:/WWW.ddbj.nig.ac.jp,创建于1986年，由日本国家遗传学研究所负责管理。,二、蛋白质数据库,包括蛋白质序列数据库、蛋白质结构数据库、蛋白质结构分类数据库。,（一）蛋白质序列数据库 1.SWISS-PROT 建立于1986年，1987年起由日内瓦大学(University of Geneva)医学生物化学系和 EMBL 数据馆(即现在的欧洲生物信息研究所EBI)共同维护。是欧洲最主要的蛋白序列数据库，世界两大蛋白序列数据库之一。SWISS-PROT由EMBL核苷酸序列库翻译而来。,2.PIR,PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，包含超过142,000条蛋白质序列(至99年9月)，其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库，每周可以得到更新部分。,(三)蛋白质结构数据库,1.PDB 蛋白质的基本立体结构数据库为PDB(Protein Data Bank)，1971年建立于美国布鲁海克海文国家实验室。该数据库中收集了通过X射线衍射和核磁共振（NMR）试验测定的蛋白质结构的精确坐标数据。这种数据即蛋白质中的原子坐标是蛋白质结构的最细致的层次。,思考题？,（1）简述蛋白质结构数据库的主要种类和特点。（2）简述SWISS-PROT数据库的主要特点？（3）从核酸序列数据库获取一条核酸序列，如何预测其翻译的蛋白质结构？（4）从蛋白质数据库获取几条蛋白质序列，分别用Blast软件和ClustalW软件进行双重和多重比对，分析比对结果。,Thanks!,

注意事项

本文（第6章生物信息学在蛋白质工程中的应用.ppt）为本站会员（文库蛋蛋多）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。