KEGG数据库的使用说明.docx
《KEGG数据库的使用说明.docx》由会员分享,可在线阅读,更多相关《KEGG数据库的使用说明.docx(10页珍藏版)》请在三一办公上搜索。
1、KEGG数据库的使用说明KEGG数据库的使用方法与介绍http:/www.genome.jp/ KEGG的数据 KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外 KEGG中有一个“专有名词”KO,它是蛋白质的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO标签。下面就首先来讲一下KEGG orthology。 任找一个代谢通路图,在上方有pathway meue | payhway entry |
2、Show(Hide) description | 这3个选项,点击pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。就进入了Ortholog table如下的页面: 在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类。如上图has后有3101,3
3、098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。空白则表示在该物种中不存在这种酶。 点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种基因组去了;点击P,则显示相应的代谢通路。下面我们点击3101,如下: 如上图,就是我们常见的一个页面,3101是KEGG中的基因ID, H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。 所以从Ortholog table中可以很容易地知道一张代谢通路上有哪些
4、KO分类,并且这些酶类的成员在各物种中分配存在的情况以及特定的名称。 怎么看KEGG中代谢通路图 比如以上这个图,方框一般就是酶,方框里面的5.4.2.2不是IP 而是EC编号;小圆圈代表代谢物,你把鼠标放上去,会出现C00668的东西,C代表compound,00668是这种化合物在KEGG中的编号,一般在KEGG中数据条目都是这样的,前面一个标志,后面一个五位数编号;大的圆方块,就表示是另一个代谢图了,所以就不展开了。 但是:为什么这个图上有的小框框是绿色呢? 因为这是一张特定物种的代谢图,蓝色的框框表示专属于这个物种。在KEGG中有两种代谢图,一种是参考代谢通路图reference pa
5、thway,是根据已有的知识绘制的概括的、详尽的具有一般参考意义的代谢图,这种图上就不会有绿色的小框,而都是无色的,所有的框都可以点击查看更详细的信息;另一种就是像上面这样的属于特定物种的代谢图species-specific pathway,会用绿色来标出这个物种特有的基因或酶,只有这些绿色的框点击以后才会给出更详细的信息。这两种图很好区分,reference pathway 在KEGG中的名字是以map 开头的,比如map00010,就是糖酵解途径的参考图,而特定物种的代谢通路图开头三个字符不是map而是种属英文单词的缩写比如酵母的糖酵解通路图,就是sce00010,大肠杆菌的糖酵解通路图
6、就应该是eco00010吧。 那么:怎么找这两种图呢? 有下拉列表的时候,在列表选择reference 或者是特定物种即可。 在pathway检索的页面http:/www.genome.jp/kegg/pathway.html ,如下图: 默认的就是map,参考图,你想要什么物中的代谢图写上它的名称就好了,如果不知道是哪3个字母,点击organism 选择即可。 顺便问一下:怎么找基因呢? 还是上面这张图,看到了吗,除了PATHWAY之外是不是还有 BRITE、DISEASE.以及GENES等等,点击基因GENES,就可以查找基因了,如下图: 不过这里要按一定的格式输入要查找的目的基因,比如它
7、给出的示例:syn表示物中,ssr3451表示基因ID,查找出来的基因名称是psbE。其实我试了一下,若直接检索基因名称syn:psbE 也是一样的。因为我不知道KEGG中基因ID如何编制的,但是,我同时也不知道基因的名称是如何定义的。比如果糖1,6-二磷酸酶Fructose 1,6-biphosphatase 的基因就叫fbp,我放进去能检索,但是我把有名的gal填上去就不能检索,当然这可能与基因后面的乱七八糟的序号后缀有关,比如填上gal1就能检索了,所以我真不知道基因到底怎么命名的?当然我在syn中没找到gal1在sce中检索到了,这也说明了基因果然不是乱长的。 依旧是上面这个图,看到K
8、EGG2了吗?点击。也会出现检索框,这是一个总体性地检索框,在这里面输入关键词,代谢通路也好,glycolysis也好, gal也好,化合物也好,没那么多限制,KEGG中的相关东西都会检索出来,在这里浏览一下,再进行后续检索,也是一个不错的方法。 当然,代谢通路图,还有其他的查看形式,以及图上可以点击,链接到这链接到那,点来点去总能点出奇怪的页面来,熟悉一下也就熟悉了,这些东西会很有用,所以我就不说了。下面讲一下KEGG的自动注释功能。 KEGG的自动注释 KEGG Automatic Annotation Server,KEGG的自动注释服务简称KAAS。在线网址为http:/www.gen
9、ome.jp/tools/kaas/ 。就是你提交一段蛋白质序列或者基因序列,它自动在内部进行相似性比对,找到最相似的基因,并确定检索基因的KO分类,然后给出这些基因所在的代谢通路并以以不同的颜色标示这些基因。如下图: 我在help中随便复制了它的两条示例氨基酸序列,然后粘贴到检索框中,进行了检索。检索框默认的蛋白质序列,如果不是的话要改选。然后填上一个邮箱地址,点击又下角的compute即可。不出意外的话,你在接下来的页面中应该看不到任何结果,甚至连提示都没有,原来它把结果发到你邮箱去了。我也不明白就一个网页链接为什么还硬要发送到邮箱。 首先发你一封信说已经接受,并给你一个期待结果显示的网址
10、,一段时间后,会发你另外一封邮件,说已经完成。打开它给的网址,就能看到结果了,如下: 看来从1:20开始计算到1:50 才结束,两条氨基酸链计算了30分钟。人家说了,计算时间是与要和检索序列对比的目标序列成正比,因此在检索的时候最好限制一下检索范围。 点击html 有两条代谢通量图的条目,点开他们就可以直观地看出我们检索的未知序列在代谢通路中的位置和作用了。Text给出的是两个KO分类。 好像北京大学的生命科学学院也搞了一个KOBA,也是基于KEGG 中的KO进行注释的一个服务,应该和这个差不多吧。 代谢通路的着色 怎么在KEGG检索出来的代谢通路中给特定的一些化合物或者基因着色以高亮显示呢?
11、 进入网页 http:/www.genome.jp/kegg/tool/color_pathway.html ,或者由pathway主页的Color objects in KEGG pathways进入,看图: 如上图,search against 下拉出你可供选择的代谢通量图,总所周知的一个很烦人的问题就是,在这些下拉列表中,条目排序竟然是乱七八糟的很难索引。还好我发现把焦点定在这个下拉列表的最顶端的文本框上,然后在键盘上拼写你要的那个物中的英文单词,只需要拼两三个字符相应的代谢通量图就出现在顶端了。比如我要找酵母的代谢通量图,只需要在文本框变蓝的时候拼写“sacc”这几个字符“Saccha
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- KEGG 数据库 使用说明
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3160109.html