大规模表达序列标签测定及分析.ppt
《大规模表达序列标签测定及分析.ppt》由会员分享,可在线阅读,更多相关《大规模表达序列标签测定及分析.ppt(54页珍藏版)》请在三一办公上搜索。
1、大规模表达序列标签(EST)测定及分析,中山大学生科院,主要内容,什么是EST?EST的应用 EST序列测定及分析过程实例:家猪脑组织EST分析,ESTs的来源 上世纪80年代,对cDNA序列进行大规模测序的想法就曾提出,但对此一直存在争论,有人认为这种方法能发现成千上万的新基因;而反对者则认为cDNA序列缺少重要的基因调控区域的信息。90年代初Graig Venter 提出了EST的概念,并测定了609条人脑组织的EST,宣布了cDNA大规模测序的时代的开始(Adams et al.,1991)。,93年前ESTs数据收录于GenBank,EBI和DDBJ。1993年NCBI(Nationa
2、l Center of Biotechnology Information)建立了一个专门的EST数据库dbEST来保存和收集所有的EST数据。,什么是 ESTs?,ESTs(Expressed Sequence tags)是从已建好的cDNA库中随机取出一个克隆,从5末端或3末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。,ESTs与基因识别 ESTs已经被广泛的应用于基因识别,因为ESTs的数目比GenBank中其它的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因(Boguski et al.,1994).在同一物种中搜寻基因家族的新成员
3、(paralogs)。在不同物种间搜寻功能相同的基因(orthologs)。已知基因的不同剪切模式的搜寻。【注:不过很难确定一个新的序列是由于交替剪切产生的或是由于cDNA文库中污染了基因组DNA序列(Wolfsberg et al.,1997)】,ESTs与基因图谱的绘制 EST可以借助于序列标签位点(sequence-tagged sites)用于基因图谱的构建.STS本身是从人类基因组中随机选择出来的长度在200-300bp左右的经PCR检测的基因组中唯一的一段序列。来自mRNA的3非翻译区的ESTs更适合做为STSs,用于基因图谱的绘制。其优点主要包括:由于没有内含子的存在,因此在cD
4、NA及基因组模板中其PCR产物的大小相同;与编码区具有很强的保守性不同,3UTRs序列的保守性较差,因此很容易将单个基因与编码序列关系非常紧密的相似基因家族成员分开。(James Sikela等,1991年)GeneMap 96 定位了16,000个基于基因的STS(Schuler et al.,1996);GeneMap 98 定位了30,000个基于基因的STS(Deloukas et al.,1998),而且基因图谱随着STS的定位正在不断的更新中。,ESTs与基因预测 由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样品特定发育时期和生理状态下的一个基因的部分序列。使用
5、合适的比对参数,大于90的已经注释的基因都能在EST库中检测到(Bailey et al.,1998)。ESTs可以做为其它基因预测算法的补充,因为它们对预测基因的交替剪切和3 非翻译区很有效。,ESTs与SNPs 来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。最近的许多研究都证明对ESTs数据的分析可以发现基因相关的SNPs(Buetow et al.,1999;Garg et al.,1999;Marth et al.,1999;Picoult-Newberg et al.,1999)。应注意区别真正的SNPs和由于测序错误(ESTs为单向测序得来,错误率可达2)而
6、引起的本身不存在的SNPs。解决这一问题可以通过:提高ESTs分析的准确性。对所发现的SNPs进行实验验证。,利用ESTs大规模分析基因表达水平 因为EST序列是从某以特定的组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化和差减杂交的cDNA文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的cDNA文库则不能反应基因表达的水平。CGAP 为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(Cancer Genome Anatomy Project,CGAP)构建了很多正常的或是癌症前期的和癌症后期的组织的cDNA文库,并进行了大规模的EST测序
7、,其中大部分的文库未经标准化或差减杂交处理。CGAP网站提供了多种工具用以分析不同文库间基因表达的差异,如:Digital Gene Expression Displayer(DGED)cDNA xProfiler 基因表达系列分析(Serial Analysis of Gene Expression,SAGE)基因表达系列分析是一种用于定量,高通量基因表达分析的实验方法(Velculescu et al.,1995)。SAGE的原理就是分离每个转录本的特定位置的较短的单一的序列标签(约9-14个碱基对),这些短的序列被连接、克隆和测序,特定的序列标签的出现次数就反应了对应的基因的表达丰度。D
8、NA微阵列或基因芯片的研究 高密度寡核苷酸cDNA 芯片或cDNA微阵列是一种新的大规模检测基因表达的技术,具有高通量分析的优点。在许多情况下,cDNA芯片的探针来源于3EST(Duggan et al.,1999),所以EST序列的分析有助于芯片探针的设计。,Serial analysis of gene expression(SAGE)技术流程,基因芯片或微阵列技术流程,几种大规模分析基因表达水平的方法的比较,ESTs很短,没有给出完整的表达序列;低丰度表达基因不易获得。由于只是一轮测序结果,出错率达2%-5%;有时有载体序列和核外mRNA来源的cDNA污染或是基因组 DNA的污染;有时出
9、现镶嵌克隆;序列的冗余,导致所需要处理的数据量很大。,ESTs数据的不足,EST技术流程,一、cDNA文库构建,非标准化的cDNA文库的构建。(可用于基因表达量的分析)经标准化或扣除杂交处理的cDNA文库。(富集表达丰度较低的基因)OligoT cDNA文库。随机引物cDNA文库。,cDNA文库的构建及其均一化扣除杂交处理,For subtraction of cDNA libraries the procedure is similar to normalization,except that the PCR products arise from a different library(w
10、hose genes are to be subtracted from the original library),Reference:Bonaldo,M.F.,et.al,1996.Normalization and subtraction:Two approaches to facilitate gene discovery.Genome Res.6:791-806.,扣除杂交技术的发展,扣除杂交技术最早应用是在20世纪80年代初,当时的目的是为了构建 非洲爪蟾的胚囊 cDNA文库【Science(Wash DC)222,135139】和制备差异表达基因的特异探针【PNAS.81,219
11、42198】。差异表达的基因通过检测样本cDNA(tester)和过量的对照样本mRNA(driver)的相互杂交而得到。在检测样本cDNA(tester)和对照样本mRNA(driver)同时表达的基因会形成mRNA/cDNA 杂交分子,而检测样本特异表达的基因则保持单链状态。单链分子和双链分子通过羟磷灰石层析而分离,分离得到的单链分子是检测样本特异表达的基因。差异表达的cDNA可以直接被克隆或通过cDNA文库筛选而得到。这个方法后来又得到改进,包括用生物素标记【Nucl.Acids 14,1002710044】和oligo(dT)30-latex标记cDNA,以增加单双链分子的分离效率。后
12、来,通过PCR选择性cDNA扩增技术被应用到扣除杂交中,以克服以往扣除杂交中需要大量起始mRNA的缺点,并可以同时提高基因克隆地效率【Nucl.Acids Res.19,7097-7104】。扣除技术的进一步成熟是在1996年,Gurskaya 等(1996)和Diatchenko 等(1996)同时发表了关于扣除杂交的改进方法,其主要的技术方法类似,这个技术叫抑制性扣除杂交技术(Suppression Subtractive Hybridization,SSH)【Anal.Biochem.240,9097;PNAS.93,6025-6230】。,SSH的原理与基本过程,原理:SSH的基本原理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大规模 表达 序列 标签 测定 分析

链接地址:https://www.31ppt.com/p-6385547.html