序列比较的生物学基础.ppt
《序列比较的生物学基础.ppt》由会员分享,可在线阅读,更多相关《序列比较的生物学基础.ppt(36页珍藏版)》请在三一办公上搜索。
1、序列比较的生物学基础,构成生命的基本单位是蛋白质;20种氨基酸组成的多肽折叠而成;什么决定蛋白质的氨基酸序列?DNA由4种脱氧核苷酸组成:ATGCRNA由4种核肝酸组成:AUGC重要特征:互相配对4种核苷酸组成64个三联密码子形成6个开放读码框序列测定,序列比较的生物学基础,构成生命的基本单位是蛋白质。而作为在细胞中催化各种化学反应的分子机器的酶,也是蛋白质。另外,细胞的许多结构也是蛋白质组成的。连非蛋白质的构成部分也是由属于蛋白质的酶所催化生产的。一个人体含有大约100,000种不同的蛋白质,正是这100,000种蛋白质的特性及其相互作用使我们无所不能。,序列比较的生物学基础,蛋白质由20种
2、氨基酸组成的多肽折叠而成。蛋白质由20种不同的氨基酸组成不同长度的聚合体,也称为肽或多肽。由这种线性拓朴结构的聚合体折叠起来产生形状各异的不同蛋白质,不同的形状以及20种氨基酸的化学特性决定了蛋白质的功能。现代生物学中的一个很主要的概念是,蛋白质的功能特性主要决定于线性多肽链中20种氨基酸的序列。由于大多数蛋白质都是自身折叠而成,所以理论上知道了一个蛋白质的序列后即可推导出其功能。,序列比较的生物学基础,什么决定蛋白质的氨基酸序列?分子生物学的中心内容就是描述我们从父母获得的遗传信息是如何储存于DNA中,它们是如何被用于复制相同的DNA副本,如何从DNA转录到RNA再翻译到蛋白质的。,序列比较
3、的生物学基础,DNA由4种脱氧核苷酸组成:ATGC。DNA是由4种脱氧核苷酸形成的线性多聚体,这4种核苷酸是:腺嘌呤脱氧核苷单磷酸(deoxyAdenosine monophosphate,A)、胸腺嘧啶脱氧核苷单磷酸(deoxyThymidine monophosphate,T)、鸟嘌呤脱氧核苷单磷酸(deoxyGuanosine monophosphate,G)、胞嘧啶脱氧核苷单磷酸(deoxyCytidine monophosphate,C)。,序列比较的生物学基础,RNA则是由A、U、G、C,4种核苷酸形成的相似线性多聚体,这4种核苷酸是:腺嘌呤核苷单磷酸(Adenosine mono
4、phosphate,A)、尿嘧啶核苷单磷酸(Uridine monophosphate,U)、鸟嘌呤核苷单磷酸(Guanosine monophosphate,G)胞嘧啶核苷单磷酸(Cytidine monophosphate,C)。,序列比较的生物学基础,DNA和RNA的重要特征:互相配对DNA和RNA的一个重要特征是线性多聚体可以互相配对,其配对是序列特异的,由此而形成的双链聚合体因其特殊的形状而被称为“双螺旋”(double helix)。双链中G与C配对,A与T或U配对,其中一链可以作为合成另一链的模板,这就是DNA复制以至所有遗传学的基础。由DNA转录为RNA也使用类似的模板合成方式
5、,而由RNA序列转化为蛋白质序列则较为复杂,这是通过三联密码子翻译成氨基酸的过程完成的,这一过程有转移RNA和核糖体(tRNA和ribosomes)的参与。,序列比较的生物学基础,遗传密码三联子 mRNA上每3个核苷酸翻译成蛋白质多肽链上的一个氨基酸,这3个核苷酸就称为一个密码,也叫三联子密码。翻译时从起始密码子AUG开始,沿mRNA53的方向连续阅读直到终止密码子,生成一条具有特定序列的多肽链。mRNA中只有4种核苷酸,而蛋白质中有20种氨基酸,若以一种核苷酸代表一种氨基酸,只能代表4种(41=4)。若以两种核苷酸作为一个密码(二联子),能代表42=16种氨基酸。而假定以3个核苷酸代表一个氨
6、基酸,则可以有43=64种密码,满足了编码20种氨基酸的需要。,序列比较的生物学基础,4种核苷酸组成64个三联密码子。4种核苷酸可以组成64个不同的三联密码子(triplet codes),用于编码20种氨基酸绰绰有余。其中三个为终止密码子,代表多肽序列的末端,一种氨基酸可以由16个三联密码子编码。由多个密码子编码的氨基酸,不同密码子的使用频率并不相等,这种使用频率的不同分布称为“密码子偏好”(coden usage)。不同种的生物密码子偏好不同。,序列比较的生物学基础,4种核苷酸组成61个编码氨基酸的密码子和3个终止密码子,它们不能与tRNA的反密码子配对,但能被终止因子或释放因子识别,终止
7、肽链的合成。由一种以上密码子编码同一个氨基酸的现象称为简并(degeneracy),对应于同一氨基酸的密码子称为同义密码子(synonymous codon)。,序列比较的生物学基础,形成6个开放读码框 由于氨基酸是由三联密码子编码的,因此DNA序列就包含三个不同的开放读码框,取决于从第一、第二或第三位核苷酸开始(第四位和第一位同框)。而双链DNA的两条链都可以转录RNA,后者翻译蛋白质。因此,一个DNA序列及其互补链可以有6个不同的读码框(reading frames)。,序列比较的生物学基础,基因一般概念 基因作为唯一能够自主复制、永久存在的单位,其生理学功能以蛋白质形式得到表达。DNA序
8、列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成mRNA,翻译生成蛋白质的过程控制所有生命现象。编码链(coding strand)又称sense strand,是指与mRNA序列相同的那条链。非编码链(anticoding strand),又称antisense strand,是指那条根据碱基互补原则指导mRNA生物合成的DNA链。,序列比较的生物学基础,基因表达的一般概念 基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(除了TU之外)的RNA单链的过程,是基因表达的核心步骤。翻译是指以新生的mRN
9、A为模板,把核苷酸三联子遗传密码翻译成氨基酸序列、合成蛋白质多肽链的过程,是基因表达的最终目的。只有mRNA所携带的遗传信息才被用来指导蛋白质生物合成,所以人们一般用U、C、A、G这4种核苷酸而不是T、C、A、G的组合来表示遗传性状。,序列比较的生物学基础,序列测定。可以用化学方法测定蛋白质的氨基酸序列以及DNA和RNA的核苷酸序列。可是,就目前来说,测定DNA的核苷酸序列比测定RNA序列和蛋白质序列容易的多。由于蛋白质序列可以由编码它的DNA序列推导出来,许多已知的蛋白质序列其实就是从DNA序列推导出来的。将mRNA转为DNA(cDNA)是一个简单的实验技术,因此RNA分子的序列通常是以cD
10、NA序列测定的。序列分析其实就是从已知蛋白质、RNA、DNA序列作出生物学推论的过程。,序列分析的困难,技术欠缺DNA非编码区比编码区多编码区不连续:内含子、外显子mRNA非编码区、tRNA、SnRNA从DNA序列推导蛋白质序列从蛋白质序列推导结构和功能二级结构:alpha helix、beta sheet超级二级结构、三级结构、四级结构为什么结构命名如此复杂?结构决定功能、实验方法欠缺蛋白质三级结构推导的基础目前不能从结构推导功能,序列分析的困难,技术欠缺。尽管从理论上来说,知道一个蛋白质的序列后,完全可以推导出它的特性,可是目前的生物学技术还远远不能做到这一点。当前的序列分析手段实际能做的
11、与希望做到的还相去甚远。下面就谈谈序列分析困难在哪里。另外,上面也已提到,由于蛋白质序列测定的困难,目前大多数的蛋白质序列其实都是由编码它的DNA推导出来的。遗憾的是,从DNA转录RNA再翻译蛋白质的细胞学途径所具有的特点使这种推导难度大增。,序列分析的困难,DNA非编码区比编码区多。许多蛋白质是由一个片段的DNA编码的,所以当分析DNA序列时,生物学家只需要知道蛋白质编码区从哪里开始,到哪里结束。然而在人类基因组中情况就不是那么简单了,因为人类基因组中包含着远远多于编码区的非编码区序列,随机获取的一个片段很可能并不编码任何蛋白质。,序列分析的困难,编码区不连续:内含子、外显子。编码蛋白质的D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 序列 比较 生物学 基础
链接地址:https://www.31ppt.com/p-5973859.html