NCBI获取序列数据ppt课件.ppt
《NCBI获取序列数据ppt课件.ppt》由会员分享,可在线阅读,更多相关《NCBI获取序列数据ppt课件.ppt(68页珍藏版)》请在三一办公上搜索。
1、,NCBI:获取核酸和蛋白质序列数据,生物信息学,本课程主要学习的内容,1、获取文献信息和序列数据2、序列比对基础与BLAST入门 3、核酸序列分析4、蛋白质序列分析及结构模拟5、系统发育分析6、基因组分析,NCBI :获取核酸和蛋白质序列数据,要想在 NCBI 中获取核酸和蛋白质的序列有多种路径(殊途同归)。本次课通过一个示例(RBP4)主要介绍一种方法 。,NCBI :获取核酸和蛋白质序列数据,获取序列信息的途径何谓参考序列GenBank 序列格式的读解,示 例,假定我们对人类视黄醇结合蛋白4(retinol-binding protein 4,RBP4)感兴趣,我们可能关心以下几个问题:
2、想获取编码RBP4的mRNA(cDNA)序列 获取RBP4核酸序列想获取RBP4这个蛋白质的氨基酸序列 获取RBP4蛋白质序列想获取编码RBP4的基因信息 获取RBP4基因(DNA),DNA,mRNA,Central dogma of molecular biology,复制,转录,翻译,protein,cDNA,RBP4,路径 1:直接通过 NCBI 主页的 Search下拉条,2、输入查询内容,1、选择数据库GeneNucleotideProtein,Nucleotide 数据库包括了,路径2:搜索所有数据库显示结果会是什么呢?,NCBI的Entrez 检索系统在所有数据库中搜索含有Rbp
3、4的记录,通过 Entrez Gene 获取人类RBP4的参考序列(RefSeq),使用Limits功能限定种属为人类,人类Rbp4基因,HGNC 人类基因命名委员会,HPRD 人类蛋白质参考库,1. 概要,2. 基因区域图,3. 基因定位图,mRNA links,DNA links,Protein links,4. NCBI参考序列,RBP4 蛋白质参考序列的链接,RBP4 mRNA参考序列的链接,NCBI :获取核酸和蛋白质序列数据,获取序列信息的途径何谓参考序列GenBank 序列格式的读解,RefSeq(Reference Sequences, 参考序列),GenBank中对应于某个基
4、因(DNA)、mRNA(cDNA)或蛋白质的序列可能有上百个,但相应的 RefSeq 记录只有一个。RefSeq 是NCBI将 GenBank 的序列再做详细整理的非冗余(non-redundent)序列。RefSeq 对应于最稳定、最被人们承认因而也是最具代表性的序列。,当存在可变剪切的情况下,一个基因的表达产物就会对应不止一个 RefSeq 记录。 例如 :human myoglobin (人类肌红蛋白)有3个 RefSeq 记录:,RefSeq(Reference Sequences, 参考序列),NM_005368 NM_203377 NM_203378,NP_005359 NP_97
5、6311 NP_976312,当不同的基因编码的蛋白具有相同的氨基酸序列时,这些蛋白质具有各自不同的 RefSeq 标识符,例如: 人类 alpha-1 globin 和 alpha-2 globin 基因编码的蛋白质其氨基酸序列相同,但分别具有各自的 RefSeq 标识符:NP_000549 和 NP_000508。,RefSeq(Reference Sequences, 参考序列),4. NCBI参考序列,点击RBP4 mRNA参考序列的链接获取序列信息,以GenBank 序列格式显示RBP4mRNA序列的详细信息,NCBI :获取核酸和蛋白质序列数据,获取序列信息的途径何谓参考序列Gen
6、Bank 序列格式的读解 以rbp4的mRNA(cDNA)参考序列为例,GenBank 序列格式(教材 Page 1318),GenBank 数据库采用的GenBank 序列格式已经成为序列标准格式的一种。GenBank 序列格式中对序列信息分不同的字段进行详细的标注,如序列的名称、性质、种属来源、相应的参考文献等。,LOCUS:该字段所包含的内容从左至右依次为 Locus 名称:NM_006744 序列长度:941 bp 分子类型:mRNA(cDNA) linear(线性) GenBank数据分类:PRI(灵长类序列) 序列最后修改日期:01-MAR-2009,GenBank 数据分类(教材
7、 Page 1314,表 2-3),GenBank 将数据库分成18个部分:1. PRI primate sequences 灵长类序列2. ROD rodent sequences 啮齿类序列3. MAM other mammalian sequences 其他 哺乳类序列,GenBank 数据分类,4. VRT other vertebrate sequences 其他脊椎动物序列5. INV invertebrate sequences 无脊椎动物序列6. PLN plant, fungal, and algal sequences 植物、真菌和藻类序列,GenBank 数据分类,7.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NCBI 获取 序列 数据 ppt 课件
链接地址:https://www.31ppt.com/p-2003345.html