BioEdit及MEGA分析序列同源性简介.docx
BioEdit及MEGA分析序列同源性简介利用系统进化分析软件对序列进行同源性分析 1.0 目的 1.1 为了保持国际上各个耐药性实验室的高检验水准,进行分子进化分析是有很重要作用的。它不仅可以保证流行病学目的顺利实现,而且有利于发现检测阶段可能产生的潜在的交叉污染。 1.2 1.3 1.4 2.0 仪器设备 2.1 2.2 2.3 3.0 计算机一台。 Windows 95以上的操作系统。 BioEdit 以及 MEGA 4 分析软件。 2.3.1 均为免费软件,可以从互联网上下载,在计算机上进行安装。 操作过程 3.1 局限及要求 3.1.1 经过序列编辑软件拼接处理后的txt文件或fasta文件均可,例如ChromasPro软件。 3.1.2 可以在MEGA上分析的分子序列或距离矩阵数据。 3.1.3 Mega 4软件只能将长度相等的序列转换为MEGA输出文件,因此,任何多序列文件必须通过BioEdit软件进行对齐修剪,然后才能进入通过Mega软件转换成*.meg格式进行分析。 3.1.4 该数据集的大小受限于计算机上可用的物理和虚拟内存。 3.1.5 分析的序列必须包括两个或两个以上长度相同的序列,所有序列分析之前必须用MEGA软件对齐。 3.1.6 核苷酸和氨基酸序列应该用英文字母连续书写,不区分大小写。一些特殊的特殊符号,例如表示对齐缺口,碱基缺失等的符号也可以包含在序列中。 3.1.7 空格和制表符经常用于数据文件中,因此会被MEGA忽略。 ASCII字符,如,一般都作为特殊符号利用此软件进行分析所得的信息对于进行艾滋病毒在人群中传播的流行病学研究具有十分重要的意义。 通过对实验室之前分析的数据与当前数据进行比较,可以发现在此前实验过程中由于标本处理不当所导致的潜在的实验室污染。 对于确保得到高质量的实验结果并及时发现可能出现在实验室里的问题具有重要意义。 来表示序列中的不同碱基,分别表示第一个序列,对齐缺口及碱基缺失。 3.1.8 BioEdit 软件进行序列比对 3.1.9 双击BioEdit 图标 打开BioEdit 序列对比编辑器窗口。 3.1.10 从工具栏上,单击new alignment图标打开一个新窗口。 3.1.11 点击 File 菜单, 选择 import and sequence alignment file 3.1.12 出现一个新窗口, 选择要导入的文件存储地址及文件名, 点击 open. 所有需要的序列都会在导入窗口中呈现。 3.1.13 点击Edit 并选择 Select All Sequences,现在可以准备对所有的序列进行比对。 3.1.14 点击 Accessory Application 并选择ClustalW Multiple alignment ,打开一个新窗口。 3.1.15 点击窗口下方的 Run ClustalW ,将打开一个新窗口,点击下方的OK. 3.1.16 序列比对将进行,进行的时间取决于所要比对的序列的长度及数量。 3.1.17 比对结束后,经过比对的序列将呈现在一个新窗口中。 3.1.18 将模式栏中改为edit,即可对序列进行剪切,使其长度一致。 3.2 3.3 比对及编辑结束后,点击File 并选择 Save 保存比对后的文件. 用MEGA软件分析进行距离和系统进化分析 3.3.1 双击MEGA4 图标打开 MEGA4. 3.3.2 序列比对格式转换: 3.3.2.1 从 File 菜单中, 选择 Convert To Mega Format, 打开 Text File Editor and Format Converter 窗口。 3.3.2.2 选择屏幕中间的File and Format 对话框。 3.3.2.3 选择要导入的文件存储地址及文件名, 点击OK,在Text File Editor and Format Converter窗口中出现mega 格式的文件。 3.3.2.4 保存文件,关掉此页面返回MEGA4.主界面。 3.3.3 打开 mega 文件 3.3.3.1 从File 菜单中打开 mega文件, 选择 open data, 或从窗口中打开 Click me to active a data file. 3.3.3.2 打开文件后, Input Data 对话框将出现. 在左侧一栏选择Nucleotide Sequences,默认右侧当前选择,点击OK. 3.3.3.3 出现一个 Confirm 对话框, 点击Yes. 3.3.3.4 Select Genetic Code box opens被打开,通常默认所有选项,点击OK . 3.3.3.5 文件名及信息将会出现在窗口下方。 3.3.4 打开Mega文件后 3.3.4.1 File 菜单中, 进行编辑, 导出或转换文件。 3.3.5 Data 菜单中, 可以用不同形式浏览文件,例如转换成氨基酸形式。 3.3.6 距离分析 3.3.6.1 Distances 菜单中, 选择Compute Pairwise. 出现Analysis Preferences 窗口。 3.3.6.2 在Distance options 列表中, 选择 Nucleotide: Kimura 2-parameter for Models, 选择 Distances only for Comput, 并选择d: Transitions + transversions for Substitutions to include. 3.3.6.3 Include Sites list, 选择 Complete Deletion for Handling Gap/Missing Data, 选择 1st, 2nd, 3rd for Codon Positions/Sites Included, 点击 OK. 3.3.6.4 Pairwise Distances 窗口打开,在文件中将显示每两个序列距离的矩阵。 3.3.7 File 菜单中, 选择Export/Print Distances, 在Text File Editor and Format Converter 窗口中将出现一个名为 Distances 的文件,它显示了所有的信息及距离矩阵,保存后可以用记事本或写字板打开。 3.3.8 进化分析 3.3.8.1 Phylogeny菜单中,选择Neibour-Joining(NJ), Analysis Preferences 框将打开。 3.3.8.2 在Distance options 列表中, 选择Nucleotide: Kimura 2-parameter for Models, 选择 Distances only for Comput, 选择d: Transitions + transversions for Substitutions to include. 3.3.8.3 Include Sites list, 选择 Complete Deletion for Handling Gap/Missing Data, 选择1st, 2nd, 3rd for Codon Positions/Sites Included. 3.3.8.4 在Test of Phylogeny 列表中, 选择Bootstrap for Test of Inferred Phylogeny. 3.3.8.5 屏幕的右侧将出现一个小对话框,选择1000 for Replications, 然后点击OK, 进程框将打开。 3.3.8.6 进程结束后, Tree Explorer 窗口将显示两种进化树 。同源树Original tree 是我们所需要的。 3.3.8.7 File菜单中, you can save the tree data as可以将所做的树通过Save键保存成Tree Session File(*.mts), 或者选择Export Current Tree得到 Tree Data File(*.tre)文件, 两种格式的文件都能被MEGA或其他软件所识别。 3.3.8.8 Image 菜单中, 选择Copy to Clipboard, 进化树即可被复制并粘贴到word文档或ppt文档中进一部编辑。 3.3.9 交叉污染的判断: 3.3.9.1 如果有两个或者更多的序列在进化树中距离非常接近或者两个分支有相同的结点且有相同的水平距离,而序列之间又没什么流行病学联系, 那么这些标本则需要从核酸提取阶段进行重复检测,以此验证它们之间的相近关系并排除交叉污染。 3.4 亚型的初步分析: 3.4.1 用NCBI 基因分型工具进行亚型的初步分析。 3.4.2 双击下面的网址 http:/www.ncbi.nlm.nih.gov/projects/genotyping/formpage.cgi 3.4.3 在相应位置填入序列的FASTA/GI /Accession 格式文件。 3.4.4 点击亚型按钮。 3.4.5 出现一个扫描窗口,如果序列是单一的亚型,记录结果,如果是复杂的重组亚型,则需要对序列进行详细的系统进化分析。