欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    生物信息学第6章 表达序列标签ppt课件.ppt

    • 资源ID:2096008       资源大小:231KB        全文页数:21页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物信息学第6章 表达序列标签ppt课件.ppt

    第6章 表达序列标签Expressed Sequence Tags(EST),一、表达序列与表达序列标签,什么是表达序列?基因组表达为mRNA的序列,中心法则,EST的获得技术路线,表达序列标签(expressed sequence tag,EST),从已建好的cDNA库中随机取出一个克隆,从5末端或3末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。,一、表达序列标签,二、EST数据分析方法,去除低质量的序列(如使用Phred)应用BLAST、RepeatMasker或Crossmatch屏蔽数据组中不属于表达的基因的赝象序列(artifactual sequences)载体序列(ftp:/ncbi.nlm.nih.gov/repository/vector)重复序列(RepBase,http:/www.girinst.org)污染序列(如核糖体RNA、细菌或其他物种的基因组DNA等)去除其中的嵌合克隆,(一)序列前处理,EST数据预处理流程,聚类目的:将来自同一个基因或同一个转录本的具有重叠部分(over-lapping)的ESTs整合至单一的簇(cluster)中聚类作用:产生较长的一致性序列(contigs),用于注释 降低数据的冗余,纠正错误数据。可以用于检测选择性剪切。,(二)ESTs的聚类,(三)序列注释和分析,序列注释后续分析,三、EST的用途,基因识别 基因表达谱的构建 发现新基因 SNP(single nucleotide polymorphism)发现 电子PCR克隆,(一)ESTs与基因识别,在同一物种中搜寻基因家族的新成员(paralogs)在不同物种间搜寻功能相同的基因(orthologs)已知基因的不同剪切模式的搜寻使用合适的比对参数,大于90的已经注释的基因都能在EST库中检测到。,(二)ESTs与基因表达谱的构建,表达量比较分析:不同组织或发育阶段基因表达量比较EST来源于不同的组织,那么就可以对不同来源的基因表达进行比较,(三)ESTs与新基因预测,由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样品特定发育时期和生理状态下的一个基因的部分序列。,(四)ESTs与SNP位点预测,来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。应注意区别真正的SNPs和由于测序错误而引起的本身不存在的SNPs。解决这一问题可以通过:提高ESTs分析的准确性。对所发现的SNPs进行实验验证。,(五)电子PCR克隆,电子PCR克隆,指利用已经有的片段进行全长基因序列的分析。,5,3,5,3,四、EST数据的不足,ESTs很短,没有给出完整的表达序列;低丰度表达基因不易获得;由于只是一轮测序结果,出错率达2%5%;有时有载体序列和核外mRNA来源的cDNA污染或是基因组DNA的污染;有时出现镶嵌克隆;序列的冗余,导致所需要处理的数据量很大。,五、常用的EST数据库,(一)dbEST(database of EST),Genbank的一部分63,236,621条数据(20091016),描述:,向dbEST提交数据,按格式编辑数据通过E-mail提交更新数据,(二)UniGene数据库,Genbank的一部分一条纪录为一个gene cluster,简介,(三)Gene Indices数据库,The Institute of Genomic Research Database 中的一个子库http:/compbio.dfci.harvard.edu/tgi/,简介,数据构成,42类动物47类植物15类原生生物10类真菌,

    注意事项

    本文(生物信息学第6章 表达序列标签ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开