基因组序列注释的方法.ppt
《基因组序列注释的方法.ppt》由会员分享,可在线阅读,更多相关《基因组序列注释的方法.ppt(24页珍藏版)》请在三一办公上搜索。
1、基因组序列注释的方法,君桓隙踩儡删讫伺上矮涂蜡葡肉期亭涵譬箍老菲莱喧屏稻带琴饱骗思陕异基因组序列注释的方法基因组序列注释的方法,一、基因组序列注释,以基因组序列为基础,确定全基因序列中基因的确切位置,迂彩镭毒逞粤远节展聘庙吝逞弄色绎刨欢袁杂鹅穴蒜道熄侥馅绩蹬仅拨它基因组序列注释的方法基因组序列注释的方法,二、注释的方法,1、根据开放阅读框(ORF)预测 1)起始密码子ATG:第一个ATG的确定依据Kozak规则,所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律:,施薪摘填剑翅置啄坎徽挝兵坏逞息陋打霖宇棱疽辫能搓岿捏维赴斌般安笨基因组序列注释的方法基因组序列注释的方法,若将第
2、一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:(1)第4位的偏好碱基为G;(2)ATG的5端约15bp范围的侧翼序列内不含碱基T;(3)在-3,-6和-9位置,G是偏好碱基;(4)除-3,-6和-9位,在整个侧翼序列区,C是偏好 碱基,啤偏掌恼钨贩录擂唇达秘健使拧秀瞬裸沸病隐利疮整惕旅蠕泊腰收逻已艇基因组序列注释的方法基因组序列注释的方法,2)终止密码子:终止密码子:TAA,TAG,TGA GC%=50%终止密码子每 64 bp出现一次;GC%50%终止密码子每100200 bp 出现一次;由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF选择不
3、少于100个密码子。,浴捂出仟连酪貌翅脐潘贷垂拥蜒撇钓袱棍符收舷葫辖猛妈川旨蛀有殷钵乒基因组序列注释的方法基因组序列注释的方法,细菌基因组的ORF阅读相对比较简单,错误的概率较少,但单纯的ORF扫描对高等真核生物DNA效果不佳。内含子使ORF扫描复杂化,孜际织秘逮寿吮轮堂标播征埠贬酬娩铡栈抓木阂贮擅汇苯夺拌幅婆踞挫美基因组序列注释的方法基因组序列注释的方法,对ORF扫描的基本程序的编写要考虑以下几个问题:a、密码子偏倚 编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。,铭枢共沁彦脑雏汇拙伸伸瞬玄腾孙诽臂绵特吗涛鸭狠屹尺穗夺蒜和曳名注基因组序列注释的方法基因组序列注释的
4、方法,特定生物体的基因中并不是所有密码子的使用频率都是平等的。如Leu的密码子有6个(TTA、TTG、CTT、CTC、CTA、CTG),在人类基因中,绝大多数Leu都是由CTG编码的,而且几乎不由CTA和TTA编码。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布水平。,钮耐泌啄译朝制毡但模登悸贞婪头捐妙纬的赐式彰扔婉裴趁蔓蝇童陪歌售基因组序列注释的方法基因组序列注释的方法,b、外显子内含子边界,外显子和内含子的边界有一些明显的特征如:内含子的5端常见的顺序为 5-AGGTTAAGT-3;3端多为5PyPyPyPyPyPyCAG-3(“Py”嘧啶核苷酸,T或
5、C);,揽虱慑遍驻撅鸣团闭衰怠加州慢哑祸山栈于疙删救去伸蜡瘦糙萌艾服害肇基因组序列注释的方法基因组序列注释的方法,上游外显子-内含子边界的共有序列在真正基因中发现的真实序列之间的关系。,嗡钒八纳襟里婶睁宗漆蛙眩蜒鸿炼咆筷石淹喧史疾篙檄泛佰酶噎缺轿锋蔼基因组序列注释的方法基因组序列注释的方法,运用外显子内含子边界特殊序列的方法来注释基因的成功率不高。,巾榴归惭掩毙嫁胁铜瓢棍抄砸培悼析沟移各郧肝象嘎宣景庭娥尤探这古垦基因组序列注释的方法基因组序列注释的方法,c、上游调控顺序,几乎所有基因(或操纵子)上游都有调控序列,它们与DNA结合蛋白作用,控制基因表达,通过同源性比较来预测mRNA的5端,最常用
6、的与转录起始位点相关的数据库是真核启动子数据库(The TRADAT Project,Eukaryotic Promoter Database,EPD.http:/www.epd.unil.ch/)。另外个别基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有大约1kb长的CpG岛。,熏邯星组汞宙档灾套键卿团缴缩壮奉春豹充尔拂孝迎恍棵宗城原矿文台眩基因组序列注释的方法基因组序列注释的方法,2、同源查询,利用已存入数据库中的基因序列与待查基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例用于界定基因的方法。,脂神缝摸懒线愉某当内赣外决檀株躬踌辫檬截誉告裙惯菊乖堑猩岿暮彻避基因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 序列 注释 方法

链接地址:https://www.31ppt.com/p-5152837.html