欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    核酸与蛋白质序列分析.ppt

    • 资源ID:6119395       资源大小:807.50KB        全文页数:37页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    核酸与蛋白质序列分析.ppt

    2023/9/26,1,郑连友E-,吉林大学 药学院 基因工程教研室,生物信息学,2023/9/26,2,生物信息学,第六章、核酸和蛋白质序列分析,第六章、核酸和蛋白质序列分析,2023/9/26,3,生物信息学,第六章、核酸和蛋白质序列分析,第一节、核酸序列分析,三、DNA序列分析基础四、DNA序列分析方法,2023/9/26,4,生物信息学,第六章、核酸和蛋白质序列分析,三、DNA序列分析基础,1、DNA序列分析内容DNA序列分析 基因序列 基因表达调控信息寻找基因牵涉到两个方面的工作:识别与基因相关的特殊序列信息预测基因的编码区域结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。,2023/9/26,5,生物信息学,第六章、核酸和蛋白质序列分析,2、DNA序列功能位点 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。,2023/9/26,6,生物信息学,第六章、核酸和蛋白质序列分析,功能位点(functional site)-与特定功能相关的位点,是生物分子序列上的一个功能单元,或者是生物分子序列上一个较短的片段。功能位点又称为功能序列(functional sequence)、序列模式(motif)、信号(signal)等。核酸序列中的功能位点包括转录因子结合位点、转录剪切位点、翻译起始位点等。在蛋白质序列分析中,常使用序列模式这个名词,蛋白质的序列模式往往与蛋白质结构域或者作用部位有关。,2023/9/26,7,生物信息学,第六章、核酸和蛋白质序列分析,DNA序列功能位点示意图,2023/9/26,8,生物信息学,第六章、核酸和蛋白质序列分析,基因组序列中若干个相邻的功能位点组合形成功能区域(functional region)。功能位点分析的任务-发现功能位点特征-识别功能位点,2023/9/26,9,生物信息学,第六章、核酸和蛋白质序列分析,利用共有序列搜索功能位点 共有序列(consensus)又称一致性片段共有序列是关于功能位点特征的描述,它描述了功能位点每个位置上核苷酸进化的保守性例如:NTATN 利用共有序列进行功能位点分析牵涉到两个方面的问题,如何构造共有序列如何利用共有序列在给定的核酸序列上搜索寻找功能位点,并计算所找到的功能位点的可靠性,2023/9/26,10,生物信息学,第六章、核酸和蛋白质序列分析,3、基因识别,基因识别是生物信息学领域里的一个重要研究内容 基因识别问题,在近几年受到广泛的重视 当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列翻译解释技术,以处理大量已测定的但未知功能或未经注释的DNA序列,2023/9/26,11,生物信息学,第六章、核酸和蛋白质序列分析,(1)原核基因识别 特点:长开放阅读框;高基因;简单的基因结构;原核基因组中的GC 含量高重点在于识别编码区域,2023/9/26,12,生物信息学,第六章、核酸和蛋白质序列分析,非翻译区域(untranslated regions,UTR)编码区域两端的DNA,有一部分被转录,但 是不被翻译,这一部分称为非翻译区域 5UTR-基因上游区域的非翻译区域 3UTR-基因下游区域的非翻译区域,2023/9/26,13,生物信息学,第六章、核酸和蛋白质序列分析,对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,序列ATTCGATCGCAA(1)ATTCGATCGCAA(2)ATTCGATCGCAA(3)ATTCGATCGCAA 这三种阅读顺序称为阅读框(reading frames),2023/9/26,14,生物信息学,第六章、核酸和蛋白质序列分析,一个开放阅读框(ORF,open reading frame)是一个没有终止编码的密码子序列。原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。,2023/9/26,15,生物信息学,第六章、核酸和蛋白质序列分析,基于基因密码子特性的识别方法 辨别编码区域与非编码区域的一种方法是检查 终止密码子的出现频率 终止密码子出现的期望次数为:每21个(64/3)密码子出现一次终止密码子,2023/9/26,16,生物信息学,第六章、核酸和蛋白质序列分析,基本思想:如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。基本算法:扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。这种算法过于简单,不适合于处理短的ORF或者交叠的ORF。,2023/9/26,17,生物信息学,第六章、核酸和蛋白质序列分析,真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。,(2)真核基因识别问题,2023/9/26,18,生物信息学,第六章、核酸和蛋白质序列分析,真核基因结构示意图,真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。,2023/9/26,19,生物信息学,第六章、核酸和蛋白质序列分析,真核基因识别基本思路 找出基因两端的功能区域:转录启动区;终止区 在启动区下游位置寻找翻译起始密码子 识别转录剪切位点剪切给体位点剪切接受体位点,2023/9/26,20,生物信息学,第六章、核酸和蛋白质序列分析,真核基因识别的主要方法 从头算方法(或基于统计的方法)根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分外显子、内含子及基因间区域。基于同源序列比较的方法利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列),通过同源比较,帮助发现新基因。,2023/9/26,21,生物信息学,第六章、核酸和蛋白质序列分析,四、DNA序列分析方法,2023/9/26,22,生物信息学,第六章、核酸和蛋白质序列分析,1、遮蔽重复序列,在进行任何真核生物序列的基因辨识分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。这样,这些重复序列的定位能为其它基因特征的定位提供重要的反面信息。重复序列还常常会搅乱其它分析,特别是在数据库搜索中。,2023/9/26,23,生物信息学,第六章、核酸和蛋白质序列分析,所用程序(1)CENSOR http:/censor/(2)Repeatmasker http:/,2023/9/26,24,生物信息学,第六章、核酸和蛋白质序列分析,2、开放阅读框分析(ORF),(1)(2)http:/(3)http:/,2023/9/26,25,生物信息学,第六章、核酸和蛋白质序列分析,3、数据库搜索 TBLSTNhttp:/blast,2023/9/26,26,生物信息学,第六章、核酸和蛋白质序列分析,4、启动子分析,2023/9/26,27,生物信息学,第六章、核酸和蛋白质序列分析,(1)、启动子查询/,2023/9/26,28,生物信息学,第六章、核酸和蛋白质序列分析,(2)、启动子分析 http:/,2023/9/26,29,生物信息学,第六章、核酸和蛋白质序列分析,5、内含子剪接位点,2023/9/26,30,生物信息学,第六章、核酸和蛋白质序列分析,(1)GRAIL:,5、内含子剪接位点,2023/9/26,31,生物信息学,第六章、核酸和蛋白质序列分析,(2)SIM4:,2023/9/26,32,生物信息学,第六章、核酸和蛋白质序列分析,6、CpG岛分析,CpG岛,是指哺乳动物基因启动子及其附近大量的CpG位点(CpG表示指C、G以磷酸基连接)。事实上基因组中60%90%的CpG 都被甲基化,未甲基化的CpG 成簇地组成CpG 岛,位于结构基因启动子的核心序列和转录起始点。有实验证明超甲基化阻遏转录的进行。,2023/9/26,33,生物信息学,第六章、核酸和蛋白质序列分析,CpG岛工具用来查找一条DNA序列中CpG岛,使用Gardiner-Garden and Frommer(1987)描述的方法。用一个200bp的窗口移过序列,每次移一个碱基对,进行计算。CpG岛定义为Y值大于0.6并且GC含量大于50%的200bp序列区域。只有符合以上标准,才输入结果。CpG岛经常在脊椎动物基因的5区域发现,因此,这个程序可用来在基因组序列中查找潜在的基因。,2023/9/26,34,生物信息学,第六章、核酸和蛋白质序列分析,(1)WEBGENE的CpG分析,2023/9/26,35,生物信息学,第六章、核酸和蛋白质序列分析,(2)、EBI的CpGPLOT http:/,2023/9/26,36,生物信息学,第六章、核酸和蛋白质序列分析,7、终止信号分析http:/r.it/webgene/wwwHC polya.html,2023/9/26,37,生物信息学,第六章、核酸和蛋白质序列分析,8、基因定位分析,

    注意事项

    本文(核酸与蛋白质序列分析.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开