RepeatMasker网页版和命令行版使用说明.docx
《RepeatMasker网页版和命令行版使用说明.docx》由会员分享,可在线阅读,更多相关《RepeatMasker网页版和命令行版使用说明.docx(12页珍藏版)》请在三一办公上搜索。
1、RepeatMasker网页版和命令行版 使用说明(中文翻译版)引用自 Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr Protoc Bioinformatics. 2009 Mar;Chapter 4:Unit 4.10. doi: 10.1002/0471250953.bi0410s25.RepeatMasker是一款广泛应用于基因鉴定、分类和mask repetitive elements,包括 低复杂度序列和散布重复序列。Re
2、peatMasker通过将数据库如:Repbase中已知的重复序列 与输入的基因组序列比对来搜素重复序列。在此我们描述两个基础协议,它对如何运用 RepeatMasker去分析基因组序列的重复元件提供细节上的指导,而不论是通过网络界面还 是通过Unix/Linux命令系统。在RepeatMasker中的序列比较通常经过cross-match程序 的序列比对来实现,对于较大序列这一过程需要大量处理时间。交替协议描述的是通过应用 诸如WU-BLAST这样的选择性比对程序来怎样减少处理时间。而且RepeatMasker的优势、局 限和已被发现的漏洞将在此进行讨论,最后提供理解其处理结果的指南。在新的
3、RepeatMasker程序包中添加了鉴定蛋白质序列的重复原件的程序。要运行RepeatMasker,首先要选择重复库文件(repeat library files),这一文件包 含重复元件共有序列。目前,Repbase Update是最大的商业性(商购)重复库(free for academic use)并且包含了相当数量的包括人、啮齿动物、斑马鱼、果蝇以及拟南芥在内的 生物体。生物体的库文件中没有Repbase Update时,库文件会用RECON (Bao and Eddy, 2002;)或 RepeatScout (; Price et al., 2005)从头产生。最新版本的 REC
4、ON v.1.06 已 经发布并且可以从.中获得RepeatModeler程序包。RepeatMasker的序列比较常通过Phil Green改进的cross-match ()来实现,另外也可以为了快速程序来用 WU-BLAST (; see Alternate Proto col)来代替 cross-match。一、通过网络界面运用RepeatMaskerRepeatMasker可通过来获得,它不像命令行版本的RepeatMasker,网络版RepeatMasker 的核苷酸序列长度限制在100kb,不能分析长度超过100kb的序列(提示会在窗口中显示)。 短于100kb的序列可以用网络版R
5、epeatMasker来分析,其花费的时间与序列的长度相关。 对于北美以外的快速服务有在德国、以色列和澳大利亚的RepeatMasker镜像网站。另外, 如果常规分析大片段序列,最好是下载并本地运行命令行版本。重要的是,如果需分析的序 列超过100kb,唯一的选择就是下载RepeatMasker并在本地运行。必需资源硬件:任意一台联网的计算机。软件:浏览器如IE或火狐浏览器文件:FASTA文件或能通过网络界面处理的收集的FASTA文件。1. 点击网页浏览器,进入.通过序列名或浏览文件下载FASTA序列文件(最大100kb),或 者粘贴FASTA序列(最大100kb)到指定的文本框。如果输入的序
6、列包含非DNA符号或者序列太长,RepeatMasker会提示错误信息。-ll P iSy r*Systems A*V1 LlMC4ahglSdna36433726 (1SS13) nxvu? MIRbgiedna37273768 (1771) (TA)nhgiedna37693WXAO 分 HIRf 1XTDhgiedna4VV 4349* (1V naxe g62”6635JU。*J6511 6763 (15776)v * tv MEMO UPMO6884 7043 54 96) MXR hgljdna70647184(155)MIRbhgie_dna72607500(15039)CMIR
7、chgiettaa93709504(X3O35)MIRhgiedna96119730(1280)CMXRhgiedna97989295(12M4)MIR3hglSdna100162067(12472)OA-rtchhglSdM 10123 X0261122”) C MIR bgiedna 10641 1070 (1173) MXRc bg,8_8a 12043 X2314 (10M5) C MER121 bgie_10 C MXRb hgXe_dna 13349 142018338 L1MBMX, HfiA!*r ! 1MT1LXNB/UC W /ifTO(5SW)2X61LIMB/LIC/W
8、Yt* (0SXHE/NXRv15(165SilMrepeat243(0)SIffi/XXRCTUV /WTO 今 *、255(nyaLINE/LICTM* AfYD*468KU 891(WU/XWltype2230A *4 (0)LINE/Ll SXHE/MIR9U3,衣.SXNE/MIkSIKE/MIR140 282260X9SIOT/MIR9。226(36)SXNB/XIRM Ytf* /WTQ(0)262124SXNt/MIK1 ty c YlfW /kt台1MV?MA () (0SIKB/WXR(o31.63.3 n1.4 n a 2773x /21.0.01.2 58937.10.
9、41-3 49334.63.4i.e3780.00.00.0 49334.63.41.5I 222.60.0L* 34227.09.04.5| 2115.9 27.5 0.0| J37315.00.92.6| 9049.30.80.0I 40030.59.41.7I *| 32732.52.50.8j * 38334.24.64.1 28222.8 7.4 5.8j 27031.116.70.7 40432.47.15.0| 24026.90.00.0| 37327.711.51.3j 21235.43.5l.S| ill29.87.32.5| 390I 57732.226.63.2X61 7
10、4741C.Ci.a1.7sw scoreperc percperc ins.query sequenceposition in querysatchlng repeatposition in repeatdiv.del.begin end(left)repeatclass/famllybeginend(left)XD63831.3.31.4h918_dna3214(22325)C LIMEgLINE/L1(5868)2“1135932.713.00.8hg!8_dna490705(21834) MXRbSIHE/MIR27268(0)2277321.06.01.2hgl8_dna1375 2
11、464(20075) LlMC4aLim/Ll67407882(0)358937.10.41.3hg“_dna2598 2832(19707) MXRbSIHE/MIR20252(1)449334.63.41.6hg!8_dna3643 3726(18813) MXRSIHE/MIR1597(165)53780.00.00.0hqlSdna3727 3768(18771) (TA)nSlsplerepeac2 3(0)649334.63.41.6hg!8_dna3769 3921(18618) MXRSIHE/MIR98255(7)518222.6ie.90.0hg!8_dna4020 407
12、2(18467)C MXRSIHE/MIR(122)14078734227.09.04.Shgl8_dna4349 ”58(17781) L1HE3ELINE/L1468891(99)8261IS.927.50.0hql8_dn.5500 5568(1971)C MXRSIHE/MIR(3)2S91729137315.00.926hg”_dna6279 6511(16028) MER30DNA/MERl_type2230(0)109049.30.80.0hg!8_dna663S 6763(15776) L1PA10LIHE/L1 -60346163(5)1140030.5941.7hq!8_d
13、na6884 7043(15496) MXRSIHE/HXR79250(IB)1232732.52.S0.8hgl8_dna)064 7184(1535$) MIRbSINE/MIR140262(6)1338334.2464.1hgl8_dn7260 7S00(1S039)C MXRcSIHB/MIR(8)26019U28222.87.4S.8hgl8_dna9370 9504(13035) MXR5XHE/MXR90226(36)IS27031.116.70.7hq!8_dna9611 9730(12809)C HIRSINE/MIR(0)2621241640432.47.15.0hQ18_
14、dna9798 9995(12544) MXR3SINt/MIR1202(6)1724026.90.00.0hg!8_dna1001C 10067(”2) GA-richLowcooplexicy152(0)1837327.711.51.3hg!8_dna10123 10261(12278)C MXRSINE/MIR(47)215631921235.43.51.8hgl8_dn10641 10780(11759) MXRcSINE/MIR101238(24)20S7129.7.32.ShQ18_dna12043 12314(10225)C MER121DNA/TcMdr?(37)3607213
15、8032.26.21.6hgl8_dna133S3 13529(9010)C HIRbSINE/MZR(58)2102622227726.63.21.1hql8_dna13549 14201(8338) L1ME3ALINE/Ll54616127(46)23767616.61.81.7hqlSdna14243 16662(5877)C L1MC1LINE/L1hgl8_dna range=chrlO:62743355-62765893 Spad-0 3pad-O strand-+ repeatMasking-none CTNNNiiNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
16、NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNfWNNNNNNNNNNNNACCACTTCCTGTTGCATTTTGTCTTTCTCATTTTAATATGCCAGCTATCTTTTCTATTTCCTTCTCTGGTTTATTACCTTTTATCATATTTGACTTTGTCTTTCTTATTTCAAATCTACTTTA
17、TTGCAGATGCTACCTCAGTGTTGATGTTATTATTTTTTATCCTTACCCTTTTAGTGAATTCATTTGCACAGATAAGTCTCAAATCCATTTCTGTAAGGCCTGTCCTGAGTGTGATTTCTACCTACCTTCCTCTCAAAAACAGTCGATTGATTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
18、NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTGAATACCCATTGTAAGTTAGGTACAGGGGTAGGTATTAGGAATTCAAAAATATGGTATCTATCTTTAGGATAATACTTCCTGTTCTCTACTGGAGGTATTTTCTATTAACATGTCTCAATAATTCTTAAACTAAATATGTCAAAACTGAAGTCTATGCTTTCTTGACACAGAGTCAATCATTCCTCATATTTCCAGTGGCACCTTATATATTCAGCTCTCTAAGATAACA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- RepeatMasker 网页 命令行 使用说明
链接地址:https://www.31ppt.com/p-4888749.html