欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    序列数据库-核酸序列数据库.ppt

    • 资源ID:6416033       资源大小:4.65MB        全文页数:113页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    序列数据库-核酸序列数据库.ppt

    4.2 序列数据库,序列数据库,核酸序列数据库蛋白序列数据库,4.2 序列数据库核酸数据库,4.2.1 核酸数据库4.2.2 数据库序列格式4.2.3 数据库的查询4.2.4 数据库搜索4.2.5 数据提交4.2.6 核酸数据库使用实例,4.2.1 核酸数据库,1常用核酸序列数据库,国际上权威的核酸序列数据库 欧洲分子生物学实验室的EMBL 美国生物技术信息中心的GenBank 日本遗传研究所的DDBJ,1988年,EMBL、GenBank 与DDBJ共同成立了国际核酸序列联合数据库中心,建立了合作关系。根据协议,这三个数据中心各自搜集世界各国有关实验室和测序机构所发布的序列数据,并通过计算机网络每天都将新发现或更新过的数据进行交换,以保证这三个数据库序列信息的完整性。,三个数据库中的数据基本一致,仅在数据格式上有所差别,对于特定的查询,三个数据库的响应结果一样。这三个数据库是综合性的DNA和RNA序列数据库,每条记录代表一个单独、连续、附有注释的DNA或RNA片段。,NCBIGenBank,美国国家健康研究院(National Institurte of Health,简称NIH)于80年代初委托洛斯阿拉莫斯(Los Alamos)国家实验室建立GenBank,1982年正式运行后移交给国家生物技术信息中心NCBI,隶属于NIH下设的国家医学图书馆(National Liabraty of Medicine,简称NLM),EBI EMBL,EMBL是由欧洲分子生物学实验(European Molecular Biology Laboratory)于1982年创建的目前由欧洲生物信息学研究所EBI(European Bioinformatic Institurte)负责管理。,DDBJ,DDBJ是DNA Data Base of Japan的简称,创建于1986年,由日本国家遗传学研究所负责管理。,2其它常用核酸序列数据库,dbEST UniGene dbSNP,3GenBank、EMBL数据库结构,了解序列数据库的格式,有助于更好地使用,提高数据库检索的效率和准确性DDBJ数据库的内容和格式与GenBank相同下面分别介绍EMBL和GenBank的数据库结构,GenBank数据库结构,完整的GenBank数据库包括序列文件索引文件其它有关文件 索引文件是根据数据库中作者、参考文献等建立的,用于数据库查询。,GenBank序列文件,GenBank中最常用的是序列文件序列文件的基本单位是序列条目,包括核酸碱基排列顺序和注释两部分。目前,许多生物信息资源中心通过计算机网络提供该数据库文件,GenBank序列文件的结构,GenBank序列文件由单个的序列条目组成序列条目由字段组成每个字段由关键字起始,后面为该字段的具体说明有些字段又分若干子字段,以次关键字或特性表说明符开始每个序列条目以双斜杠“/”作结束标记,序列文件:序列条目 字段 关键字“/”,GenBank序列条目的关键字,LOCUS(序列名称)DEFINITION(说明)ACCESSION(接收编号)NID(核酸标识)KEYWORDS(关键词)SOURCE(数据来源)REFERENCE(文献)FEATURES(特性表)BASE COUNT(碱基组成)ORIGIN(碱基排列顺序),EMBL数据库结构,EMBL数据库的基本单位也是序列条目,包括核甘酸碱基排列顺序和注释两部分序列条目由字段组成每个字段由标识字起始,后面为该字段的具体说明。有些字段又分若干次子字段,以次标识字或特性表说明符开始最后以双斜杠“/”作本序列条目结束标记,EMBL条目的关键字,ID(序列名称)DE(序列简单说明)AC(序列编号)SV(序列版本号)KW(与序列相关的关键词)OS(序列来源的物种名),OC(序列来源的物种学名和分类学位置)RN(相关文献编号或递交序列的注册信息),RA(相关文献作者或递交序列的作者),RT(相关文献题目),RL(相关文献杂志名或递交序列的作者单位),RX(相关文献Mediline引文代码),RC(相关文献注释),RP(相关文献其他注释)CC(关于序列的注释信息)DR(相关数据库交叉引用号)FH(序列特征表起始),FT(序列特征表子项)SQ(碱基种类统计数),4.2.2 数据库序列格式,GenBank和EMBL数据结构对比E.coli k-12全基因组序列文件为例,LOCUS U00096 4639221 bp DNA circular BCT 18-NOV-1998DEFINITION Escherichia coli K-12 MG1655 complete genome.ACCESSION U00096KEYWORDS.SOURCE Escherichia coli.ORGANISM Escherichia coli Bacteria;Proteobacteria;gamma subdivision;Enterobacteriaceae;Escherichia.REFERENCE 1(bases 1 to 4639221)AUTHORS Blattner,F.R.,Plunkett,G.III,Bloch,C.A.,Perna,N.T.,Burland,V.,TITLE The complete genome sequence of Escherichia coli K-12 JOURNAL Science 277(5331),1453-1474(1997)MEDLINE 97426617COMMENT This sequence was determined by the E.coli Genome Project at the University of Wisconsin-Madison(Frederick R.Blattner,director).Supported by NIH grants HG00301 and HG01428(from Human Genome Project and NCHGR).The entire sequence was independently determined from E.coli K-12 strain MG1655.Predicted open reading frames were determined using GeneMark software,kindly supplied by,GenBank,FEATURES Location/Qualifiers source 1.4639221/organism=Escherichia coli/strain=K-12“/sub_strain=MG1655/db_xref=taxon:562 promoter 71.99/note=factor Sigma70;predicted+1 start at 106 promoter 104.132/note=factor Sigma70;predicted+1 start at 139 promoter 188.212/note=factor Sigma32;predicted+1 start at 219 gene 190.255/note=b0001/gene=thrL CDS 190.255/gene=thrL/function=leader;Amino acid biosynthesis:Threonine/note=o21;100 pct identical to LPT_ECOLI SW:P03059/codon_start=1/transl_table=11/product=thr operon leader peptide/db_xref=PID:g1786182/translation=MKRISTTITTTITITTGNGAG“BASE COUNT 1142136 a 1179433 c 1176775 g 1140877 t,ORIGIN 1 agcttttcat tctgactgca acgggcaata tgtctctgtg tggattaaaa aaagagtgtc 61 tgatagcagc ttctgaactg gttacctgcc gtgagtaaat taaaatttta ttgacttagg 121 tcactaaata ctttaaccaa tataggcata gcgcacagac agataaaaat tacagagtac 181 acaacatcca tgaaacgcat tagcaccacc attaccacca ccatcaccat taccacaggt 241 aacggtgcgg gctgacgcgt acaggaaaca cagaaaaaag cccgcacctg acagtgcggg 301 cttttttttt cgaccaaagg taacgaggta acaaccatgc gagtgttgaa gttcggcggt 361 acatcagtgg caaatgcaga acgttttctg cgtgttgccg atattctgga aagcaatgcc 421 aggcaggggc aggtggccac cgtcctctct gcccccgcca aaatcaccaa ccacctggtg 4639021 caacatcaac tgcaagcttt acgcgaacga gccatgacat tgctgacgac tctggcagtg 4639081 gcagatgaca taaaactggt cgactggtta caacaacgcc tggggctttt agagcaacga 4639141 gacacggcaa tgttgcaccg tttgctgcat gatattgaaa aaaatatcac caaataaaaa 4639201 acgccttagt aagtattttt c/,ID U00096 standard;circular genomic DNA;CON;4639221 BP.AC U00096;SV U00096.1DT 24-JUL-2003(Rel.76,Last updated,Version 3)DE Escherichia coli K-12 MG1655 complete genome.KW.OS Escherichia coli K12OC Bacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;OC Enterobacteriaceae;Escherichia;Escherichia coli.RN 1RP 1-4639221RX MEDLINE;97426617.RX PUBMED;9278503.RA Blattner F.R.,Plunkett G.III,Bloch C.A.,Perna N.T.,Burland V.,RT The complete genome sequence of Escherichia coli K-12;RL Science 277(5331):1453-1474(1997).DR GOA;O32528.DR REMTREMBL;AAC74436;AAC74436.DR SPTREMBL;O32530;O32530.DR SWISS-PROT;O32528;YPDI_ECOLI.,EMBL,CC This sequence was determined by the E.coli Genome Project at theCC University of Wisconsin-Madison(Frederick R.Blattner,director).CC Supported by NIH grants HG00301 and HG01428(from the Human GenomeCC Project and NCHGR).The entire sequence was independentlyCC determined from E.coli K-12 strain MG1655.Predicted open readingCC frames were determined using GeneMark software,kindly supplied byFH Key Location/QualifiersFT source 1.4639221FT/db_xref=taxon:83333FT/mol_type=genomic DNAFT/organism=Escherichia coli K12FT/strain=K12FT/sub_strain=MG1655FT promoter 71.99FT/note=factor Sigma70;predicted+1 start at 106FT CDS 190.255FT/codon_start=1FT/db_xref=GOA:P03059FT/db_xref=SWISS-PROT:P03059FT/note=o21;100 pct identical to LPT_ECOLI SW:P03059FT/transl_table=11FT/gene=thrLFT/function=leader;Amino acid biosynthesis:ThreonineFT/product=thr operon leader peptideFT/protein_id=AAC73112.1FT/translation=MKRISTTITTTITITTGNGAG“,SQ Sequence 4639221 BP;1142136 A;1179433 C;1176775 G;1140877 T;0 other;agcttttcat tctgactgca acgggcaata tgtctctgtg tggattaaaa aaagagtgtc 60 tgatagcagc ttctgaactg gttacctgcc gtgagtaaat taaaatttta ttgacttagg 120 tcactaaata ctttaaccaa tataggcata gcgcacagac agataaaaat tacagagtac 180 acaacatcca tgaaacgcat tagcaccacc attaccacca ccatcaccat taccacaggt 240 aacggtgcgg gctgacgcgt acaggaaaca cagaaaaaag cccgcacctg acagtgcggg 300 cttttttttt cgaccaaagg taacgaggta acaaccatgc gagtgttgaa gttcggcggt 360 acatcagtgg caaatgcaga acgttttctg cgtgttgccg atattctgga aagcaatgcc 420 aggcaggggc aggtggccac cgtcctctct gcccccgcca aaatcaccaa ccacctggtg 480 gcgatgattg aaaaaaccat tagcggccag gatgctttac ccaatatcag cgatgccgaa 540 tattgctatc aattagcaac attaatacaa caaccggcga aaagtgatgc aacggcagac 4639020 caacatcaac tgcaagcttt acgcgaacga gccatgacat tgctgacgac tctggcagtg 4639080 gcagatgaca taaaactggt cgactggtta caacaacgcc tggggctttt agagcaacga 4639140 gacacggcaa tgttgcaccg tttgctgcat gatattgaaa aaaatatcac caaataaaaa 4639200 acgccttagt aagtattttt c 4639221/,EMBL和GenBank数据库的行识别标志比较,4.2.3 数据库的查询,数据库查询是对数据库中的序列、结构、命名及注释信息进行关键词匹配查找。常用的数据库查询系统有美国NCBI开发的Entrez系统和EMBL开发的SRS(Sequence Retrieval System)系统。,Entrez是基于Web界面的综合生物信息数据库检索系统。是NCBI提供的集成检索工具。利用Entrez系统,使用者可以检索Genbank的核酸数据,以及Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、Medline的文献数据。Entrez所有操作都可以在网络浏览器上完成,利用Entrez界面上提供的限制条件(Limits)检索历史(History)剪贴板(Clipboard)等功能 实现各种复杂的检索查询工作,Entrez系统具有三个特点,Entrez是面向生物学家的数据库查询系统,其特点之一是使用十分方便。它把序列、结构、文献、基因组、系统分类等不同类型的数据库有机地结合在一起,通过超文本链接,用户可以从一个数据库直接转入另一个数据库。Entrez的另一个特点是把数据库和应用程序结合在一起。例如,通过“Related sequence”工具,可以直接找到与查询所得蛋白质序列同源的其它蛋白质。查询得到的蛋白质三维结构,可以通过在用户计算机上安装的Cn3D软件直接显示分子图形。Entrez系统的开发基于特殊的数据模型NCBI ASN.1(Abstract Syntax Notation),在对于文献摘要中的关键词查询时,不仅考虑了查询对象和数据库中单词的实际匹配,而且考虑了意义相近的匹配。在查询文献数据库摘要得到结果后,可以通过点击“Related Articles”继续查找相关文献。,SRS是Sequence Retrieval System的缩写,由欧洲分子生物学实验室开发,最初是为核酸序列数据库EMBL和蛋白质序列数据库SwissProt的查询开发的 SRS是欧洲各国主要生物信息中心必备的数据库查询系统,SRS是一个开放的数据库查询系统,即不同的SRS查询系统可以根据需要安装不同的数据库,目前共有300多个数据库安装在世界各地的SRS服务器上在我国,北京大学生物中心,中国科学院微生物研究所、上海生命科学院等多家单位也相继安装了SRS系统,国内的科研工作者可以利用局域网登陆使用,国际上主要SRS数据库查询系统服务器系统的网址,欧洲生物信息研究所 英国基因组资源中心 英国基因组测序中心 法国生物信息中心 荷兰生物信息中心 澳大利亚医学研究所 德国癌症研究所 http:/genius.embnet.dkfz-heidelberg.de/menu/srs/加拿大生物信息资源中心,SRS采用建立数据库索引文件的方式,能够快速高效地对各种数据库进行查询,并具有查询结果相关处理功能 可根据不同的要求利用三种方式进行查询 快速查询 标准查询 扩展查询,SRS系统主要特点,1.统一的用户界面2.高效的查询功能3.灵活的指针链接4.方便的程序接口5.开放的管理模式6.统一的开发平台,4.2.4 数据库搜索,数据库搜索与数据库查询 是本质不同的概念,1.数据库搜索的概念,数据库搜索是指通过序列相似性比对的算法,在核酸序列数据库和蛋白质序列数据库中检测出与被检序列具有一定相似性的序列(或称为同源序列),数据库搜索的基础是序列的相似性比对。对于在分子生物学研究中获得的新碱基序列或由此翻译得到的氨基酸序列,通过数据库搜索方法,得到具有一定相似性的同源序列,预测未知序列基因家族的归属,及其生物学功能。对于氨基酸序列,如果得到与已知三维结构的同源蛋白质,进而推测其可能的空间结构,预测其蛋白质功能。因此,数据库搜索与数据库查询一样,是生物信息学研究中的一个重要工具。,选择恰当的搜索算法和搜索程序,正确分析搜索结果,都是数据库搜索过程中的重要环节。目前,常用的序列类似性检索软件工具是BLAST、FASTA和BLITZ等。,一般而言,对于DNA序列相似性检索FASTA算法的敏感度较高但BLAST检索速度较快当使用BLAST和FASTA均不能找出显著相似的匹配序列时,需要采用BLITZ程序,虽然BLITZ的运行速度较慢,但是其特异性比较高,程序的选用除了考虑其算法外,还要考虑其易用性,从整体上考虑联合使用效果最佳序列相似性搜索可以通过电子邮件或下载软件和数据库到自己的计算机实现最佳方式是利用www互连网进行序列类似性搜索。Web网页服务器提供免费共享的序列数据库和高效专门的软件,运算速度快,结果可以传输到用户计算机上,2.BLAST数据库搜索工具,BLAST(basic local alignment search tool)的含义是基本局部相似性比对搜索工具其算法基本路线是找出被检测序列与已知序列之间相似性最高的片段作为中心单元,并向两端延伸找出最长的相似性序列片段,BLAST的基本思想:,序列S:,序列t:,找出两个序列共同的短片段经过扩展后形成更长的相似片断,扩展,扩展,给定一个检测序列,BLAST返回所有检测序列与数据库序列得分超过某个阈值S的片段对阈值S可以由用户设定,但程序有一个缺省的推荐值选择S的基本原则是:一条随机序列与查询序列比较的得分不会超过S,BLAST对序列格式的要求是常见的FASTA格式FASTA格式广泛应用于许多分子生物学软件包中第一行是描述行,第一个字符必须是“”字符,表示一个新文件的开始,并注释序列的相关信息随后是序列行本身,每行序列一般不超过80个字符,可用回车符,FASTA格式,sequence leaderACAGAAATTTGGCAATTCCGAGAGTACTAGCTTACGTCCAAAGTCAGTCCAGTACCGTTTTAGGGGAAACCCGGGGG,BLAST可以按照检测的序列性质和数据库序列的类型分为以下几个基本类别Blastn Blastp Blastx TBlastn TBlastx,BLAST程序检测序列和数据库类型,BLAST搜索的核酸数据库,BLAST 使用界面,3.BLAST提供了许多参数,直方图(Histogram):显示每次检索评分的直方图。有yes、no两种选择,默认值为yes。期望值(Expect,E值):它是期望数据库中具有某一统计学意义配对序列的值。有default、0.001、0.01、0.1、1、10、100、1000等选择值,默认值为10,一般地,期望值越低,限制越严格,甚至会导致无随机配对序列。,BLAST程序显示搜索结果,它包括四个部分:一是程序的介绍二是一系列配对数据库序列的描述,从记分值高到低排列,一行描述一条序列三是实际的序列对准四是检索中设定的参数及其它统计数据,4.BLAST服务的四种基本方法,经由WWW使用的BLAST 网络版的BLAST 独立运行的BLAST 电子邮件的BLAST,序列数据库搜索流程,检测序列(靶序列),服务器(NCBI、EBI),搜索程序(BLAST、FASTA),选择适合的BLAST程序,选择适当的数据库,分析输出结果,4.2.5 数据提交,GenBank的数据来源主要有是科学家直接提交的数据和测序中心以序列表达标识EST或以大量的基因组记录形式成批发送的数据,最主要的来源是科学家直接提交的数据。目前常用的提交工具是NCBI设计的Bankit和Sequin等软件。,Bankit,它的提交方法是一种基于www的网络提交软件,使用方便而且速度快。BankIt是一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。用户提交序列后,会从电子邮件收到自动生成的数据条目,Genbank的新序列编号,以及完成注释后的完整的数据记录。,数据库的提交原则,不接受长度少于50bp的序列;不接受不含有内含子的基因组序列;不接受引物序列;不接受蛋白序列;不接受基因组和mRNA的混合序列等。,提交的步骤,输入提交核酸序列的长度,点击“NEW”按钮 在原始表格中完整输入提交者和序列的基本信息及核酸序列数据检查草稿并修改可能出现的错误详细注释该记录的生物学特征的数目和类型,然后点击“Modify Submission”按钮,返回表格,输入每个特征的详细情况,包括蛋白质翻译重复第三、第四的步骤,直到整个记录完成点击“Review and Submit”按钮,检查最后的草稿点击“Submit to GeneBank”按钮,发送提交序列数据,Sequin,大量的序列提交可以由Sequin程序完成。Sequin程序能方便的编辑和处理复杂注释,并包含一系列内建的检查函数来提高序列的质量保证。它还被设计用于提交来自系统进化、种群和突变研究的序列,可以加入比对的数据。在不同操作系统下运行的Sequin程序都可以在下载。,此外,EST序列应通过EST数据库提交,EST序列的提交可以通过email方式,email地址:。,4.2.6 核酸数据库使用实例,核酸序列的检索数据库核酸序列相似性搜索,1.核酸序列的查询,以NCBI网站的ENTREZ查询系统为例登陆NCBI网站 选择Entrez 进入Entrez主页 选择检索的数据库,(1)直接查找,在查询框中键入检索词 例如输入“p53”检索词可以是GenBank接受编号、基因名、分类、关键词、注释信息、作者及文献题目等相关内容如果一次查询多个序列信息,可输入多个基因接受编号,检索结果 有若干条符合条件的序列。选择其中所需的序列,点击打开该序列的链接,得到序列的原始信息记录和注释。解读GenBank数据库序列文件的注释信息,(2)根据基因名称,以人血清白蛋白为例 基因名:ALB,通过基因名称,REFERENCE 1(bases 1 to 19002)AUTHORS Minghetti,P.P.,Ruffner,D.E.,Kuang,W.J.,Dennison,O.E.,Hawkins,J.W.,Beattie,W.G.and Dugaiczyk,A.TITLE Molecular structure of the human albumin gene is revealed by nucleotide sequence within q11-22 of chromosome 4 JOURNAL J.Biol.Chem.261(15),6747-6757(1986)PUBMED 3009475 REFERENCE 2(bases 17688 to 17755;18526 to 18555),COMMENT Computer-readable sequence in 1 was kindly provided by A.Dugaiczyk,01-JUL-1986.Draft entry and printed copy of sequence for 2 kindly provided by L.Minchiotti,09-DEC-1988.2 describes a missplicing event in alooalbumin.FEATURES Location/Qualifiers source 1.19002/organism=Homo sapiens/mol_type=genomic DNA/db_xref=taxon:9606/chromosome=4/map=4q11-q13/,(3)根据基因接受号,以人血清白蛋白 Genbank接受号:M12523,通过接受号获得序列,2.数据库核酸序列相似性搜索,利用NCBI上的BLASTn核酸搜索工具查找基因名为人ALB基因(AF116645)的相似序列,登陆NCBI网站选择BLAST 进入BLAST主页,点击进入BLASTn页面选择搜索的核酸数据库 选择人类数据库向数据库提交序列 在搜索框中键入基因接收号或粘贴FASTA格式的核酸序列,点击提交按钮 传输分析结果 服务器返回一个所提交任务的标识号(RID)稍后可输分析结果,3.数据提交,向GeneBank提交新EST序列利用email方式提交两条无高度同源性序列片段,编号为02A和03B。Email地址:,提交的内容和格式,有关文献的信息Publication FilesTYPE:PubTITLE:Identification and Characterization of genes related to gastric cancer and its premalignant lesionsAUTHORS:Weiming ZhangJOUANAL:VOLUME:ISSUE:PAGES:YEAR:STATUS:l,有关联络方式Contact FilesTYPE:ContNAME:FAX:TEL:EMAIL:LAB:INST:ADDR:,有关提交EST序列的信息EST FilesTYPE:ESTSTATUS:NewCONT NAME:EST:EST02ACLONE:cDNA fragment related to gastric cancerSOURCE:Homo sapiens gastric cancerCITATION:Identification and Characterization of genes related to gastric cancer and its premalig-nant lesionsSEQ PRIMER:M13 ForwardP END:5,HIQUAL START:1HIQUAL STOP:393DNA TYPE:cDNAPUBLIC:PUT ID:gastric cancer,gastricCOMMENT:This is a comment about the sequence It may span several linesSEQUENCE:ACTTACAGAACACTGTATTAAGAAGC-序列从略,NCBI的Email回复信息,EST序列提交后经过几个工作日,提交者可以收到NCBI以email形式的结果回复,GeneBank的接受号(GeneBank Accn)及EST数据库的识别号(dbEST Id),核酸数据库应用实习,一、实验目的与要求:,1 熟悉和掌握核酸数据库的使用2 掌握核酸序列对数据库的查询和搜索方法,二、实验步骤,实验一 数据库查询核酸序列实验二 核酸序列对数据库的搜索,实验一 数据库查询核酸序列,1 登陆NCBI网站 2 进入Entrez主页3 选择查询的数据库(GENE、核酸数据库)4 在查询框中键入检索词(用基因名称、GenBank接收号两种方式选一)5 检索结果6 解读GenBank数据库序列文件的注释信息,注释该基因的特征,实验二 核酸序列对数据库的搜索,利用NCBI上的BLASTn核酸搜索工具查找基因名为人ALB基因(AF116645)的相似序列。,实验二 核酸序列对数据库的搜索,1 登陆NCBI网站2 选择BLAST 进入BLAST主页,点击进入Blastn页面 3 选择搜索的核酸数据库 选择人类数据库 4 向数据库提交序列 在搜索框中键入基因接收号或粘贴FASTA格式的核酸序列,点击提交按钮 5 传输分析结果 服务器返回一个所提交任务的标识号(RID)稍后可传输分析结果 6 分析搜索结果,习题:1.描述几个常用核酸数据库 2.数据库查询和数据库搜索的概念3.简述BLAST的种类4.写出常用的数据库提交工具(以NCBI为例)参考书:孙啸生物信息学,

    注意事项

    本文(序列数据库-核酸序列数据库.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开