第二十五章基因结构分析的基本策略.ppt
《第二十五章基因结构分析的基本策略.ppt》由会员分享,可在线阅读,更多相关《第二十五章基因结构分析的基本策略.ppt(78页珍藏版)》请在三一办公上搜索。
1、第二十五章基因结构分析的基本策略,Basic strategy for analyzing gene structure,主要内容:第一节 基因序列结构的生物信息学检索和比对 分析第二节 基因转录起始点的鉴定第三节 启动子的结构及功能分析第四节 编码序列结构分析,第一节 基因序列结构的生物信息学检索和比对分析,就是在数据库中对基因序列或DNA序列进行 比对分析,以其能够推测出其结构、功能及在进化上的联系.比对方法:1.双重比对 2.多序列比对,序列比对目的:判断两个或多个序列间是否具有足够的相似性从而判断二者之间是否具有同源性,直接的数量关系,进化上曾具有共同祖先,基因或DNA序列比对,序列比
2、对的结果:取代插入缺失,Mouse:GGKDSCQGDSGGPVVCNG-QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANCrayfish:GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV-,缺失?,保守序列,保守序列:可能是共同进化的标志可能并不代表功能的重要性,插入?,当两个序列非常相似时,是否一定说明它们具有相似的功能?,NCBI数据库,NCBI首先创建GenBank数据库,于1991年开发了Entrez数据库检索系统,该系统整合了GenBank、EMBL、PIR和SWISS-PROT等数据库
3、的序列信息以及MEDLINE有关序列的文献信息,并通过相关链接,将他们有机地结合在一起NCBI还提供了其他数据库,包括在线人类孟德尔遗传(OMIM)、三维蛋白结构的分子模型数据库(MMDB)、人类基因序列集成(UniGene)、人类基因组基因图谱(GMHG)、生物门类(Toxonomy)等数据库,1.各种数据库的介绍,(1)Nucleotide,该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成三个组织每天交换各自数据库中的新增序列实现数据共享,(2)Genome,
4、即基因组数据库,提供了多种基因组、完全染色体、重叠序列图谱以及一体化基因物理图谱,(3)Structures,即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据,NCBI已经将结构数据交叉链接到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez获得分子的分子结构间相互作用的图像,(4)Taxonomy,即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等,(5)PopSet,包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列PopSet既包含了核酸序列数据又
5、包含了蛋白质序列数据,(7)文献数据库,PubMed:生物医药科学的检索系统 OMIM:孟德尔遗传学数据库是人类基因和基因疾病的目录数据库其他:书目,杂志,文章引用匹配等,该数据库包括原文信息、图片和参考信息,同时还可以链接到Entrez系统MEDLINE数据库中相关文献和序列信息,2.NCBI数据库检索,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed,可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式或FASTA Report格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,包括:基因位点(Locus)、基因定
6、义(Definition)、基因存取号(Accession)、核酸编号(NID)、关键词(Keywords)、来源(Source)、组织分类(Organism)、参考文献(Reference)、著者(Author)、题目(Title)、期刊(Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele)对等的肽(Mat-Peptide)、计算碱基数(Base Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。,例如:人EPO基因序列检索,输入关键词,选择合适的
7、程序,向下拉寻找符合目标的条目,点击此条打开连接,向下拉寻找关注的内容,凡是连接的地方都可以点击查看,可以直接拷贝保存相关内容,Entrez:是一个用以整合NCBI数据库中信息的搜寻和检索工具,3.NCBI数据库搜索工具,BLAST:是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段,NCBI提供的附加软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt,Entrez的一个强大和独特的特点是检索相关的序列,结构,和参考文献的能力,Entrez:,BLAST:,BLAST程序,点击核酸序列blast,在框内输入序列:,选
8、择搜索条件:,选择特殊程序:,比较两个序列之间的相似性:,以上仅简介了NCBI相关数据库及工具软件关于其他数据库及软件工具等信息见书中第二十五章表1-5。,第二节 基因转录起始点的鉴定,主要内容:一、基因转录起始点的序列特征二、基因转录起始点的序列分析,一、基因转录起始点的序列特征,1.真核基因及其调控元件,II 型启动子的TSS:没有明确的保守序列有一种趋势,即mRNA 的第一个碱基是A,其侧翼碱基倾向于是嘧啶与mRNA第一个碱基对应的位置标记为-1区-3+5区域被称作起始子(initiator),2.转录起始点(TSS),Py2CAPy5,二、基因转录起始点的序列分析,思考:转录起始点(T
9、SS)位于基因编码序列的5端基因编码区是指能体现在多肽链中的核苷酸序列多肽链是以mRNA为模板经翻译合成的,因此,分析鉴定TSS的方法都是以cDNA为切入点,1.cDNA克隆测序,AAAAAn,AAAAAn,mRNA,反转录酶,AAAAAn,Oligo(dT)15-18,cDNA第一链,CCCCC,cDNA第一链,nCCCC,nGGGG,cDNA第二链,克隆扩增,5端测序分析,反转录酶的末端转移酶活性Oligo(dG)15-18,mRNA,与线性载体相连接,要求:cDNA的5端完整无缺,2.cDNA末端快速扩增技术(RACE),传统的RACE:,mRNA,cDNA,mRNA,-5,3-,反转录
10、酶,Oligo(dT)15-18,末端转移酶,dGTP,nGGGGG,锚定PCR扩增,nGGGGG,nCCCCC,锚定引物,特异引物,PCR产物,Deep-RACE:,用寡核苷酸替代mRNA的5端帽结构以及发光标记巢氏PCR引物实现高通量鉴定转录起始点,5-p 帽,mRNA,牛小肠磷酸酶(CIP),5-帽,烟草酸焦磷酸酶(TAP),5-,将5-RACE adaptor(寡核苷酸)加到脱帽RNA分子上,5-RACE adaptor(寡核苷酸),反转录酶10nt 随机引物,5-RACE adaptor,5-RACE adaptor,5-RACE adaptor,5-RACE adaptor,长短不
11、同的cDNA,随机引物,用10nt随机引物与5-RACE引物进行PCR扩增,5-RACE adaptor,5-RACE adaptor,5-RACE adaptor,5-RACE adaptor,PCR产物,随机引物,以5-RACE引物和5端甩尾的基因特异性反向引物进行巢氏PCR,5-RACE adaptor,以5-RACE发光标记引物对PCR混合物直接进行一次性测序,分析基因转录起始点,3.连续分析基因转录起始点,在RACE的基础上,通过在转录本5 端引入一个特殊的II型限制性核酸内切酶识别位点,实现了基因5 端短片段串联连接产物一次测序分析多个基因转录起始点的目的主要有两种方法:5 端连续
12、分析基因表达(5-end serial analysis of gene expression,5 SAGE)帽分析基因表达(cap analysis gene expression,CAGE),(1)5 SAGE,5SAGE是在PCR过程中将MmeI酶切位点引物cDNA的5端,通过酶切和连接获得不同短片段重复序列,并对重复序列进行测序获得大量片段序列信息 不同序列的短片段代表不同基因的转录起始点(TSS),MmeI:是一种特殊的II型限制性核酸内切酶识别的序列不是回文结构,而是不对称的DNA序列5-TCCRAC-3(R代表G或A)在识别位点下游1820碱基处切开双链DNA,Gppp,AAAA
13、AAAAn,mRNA,用BAP和TAP处理,AAAAAAAAn,p,在RNA的5端加上寡核苷酸帽,AAAAAAAAn,XhoI,MmeI,反转录酶,RT,AAAAAAAAn,cDNA,PCR,Biotin-标记引物,随机引物,Biotin,MmeI,酶切消化,20 mer,亲和素,用亲和素-生物素,可以将5-端片段与其他片段分离开,20 mer,连接,20 mer,PCR扩增,XhoI,酶切消化,自身连接,串联体,测序分析,(2)CAGE,CAGE与5SAGE非常相似所不同的是:CAGE不需要在RNA上加接头,而是用oligo(dT)引物先进行第一链cDNA的合成然后通过捕获帽结构,将含有Mm
14、eI和另一内切酶位点如XmaJI的linker加到单链全长cDNA的3末端,AAAAAAn,Cap,mRNA,反转录酶,Oligo(dT)1518,AAAAAAn,Cap,TTTTTTTn,cDNA,捕获5-帽结构,单链linker,连接,TTTTTTTn,Biotin,cDNA第二链的合成,TTTTTTTn,AAAAAAn,MmeI,XmaJI,MmeI,酶切,亲和素,20 mer,用亲和素-生物素,可以将5-端片段与其他片段分离开,连接第二个linker,XbaI,XmaJI,XmaJI,Xbal,酶切消化,PCR(用linker1和linker2作引物),Linker 1,Linker
15、2,纯化,串联连接,克隆,20 mer,XmaJI和XbaI是同尾酶:XmaJI:CCTAGGXbaI:TCTAGA,串联体,测序分析,第三节 启动子的结构及功能分析,主要内容:一、启动子的结构分析二、启动子的功能分析,启动子(promoter)是一段能被蛋白质识别的、参与特定基因转录调控的DNA序列II型启动子通常位于结构基因的上游共通序列(consensus sequence)是其特征性序列,共通序列和启动子所处的位置是研究启动子的重要线索,共通序列,例如:原核基因的共通序列:-10区:Pribnow box(T77A76T60A61A56T82序列)-35区:T69T79G61A56C5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 十五 基因 结构 分析 基本 策略
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5679377.html