怎样获取物种所有基因对应的GO注释


这期内容当中小编将会给大家带来有关怎样获取物种所有基因对应的GO注释,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Gene Ontology是研究基因功能的重要数据库之一,在进行GO的富集分析时,需要提供所有基因对应的GO注释信息,下面介绍几种获取该信息的方式。官网提供了几种常见物种对应的GO注释信息,文件格式为GAF, 下载链接为http://www.geneontology.org/page/download-go-annotationshuman对应的文件如下该文件中提供的是uniprot数据库中的蛋白对应的GO信息,会给出蛋白对应的uniprot数据库编号,蛋白对应的基因symbol, 以及GO注释,示例如下原始文件列数很多,我只选了前4列,第一列表示数据库的名字,第二列为数据库中的编号,第三列为gene symbol, 第四列为对应的GO注释。EBI对uniprot数据库中的蛋白进行了GO注释分析,这个项目名为gene ontology annotation, 简称GOA, 在FTP也提供了物种对应的注释信息,示意图如下以human为例,FTP地址如下ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/HUMAN/这里的文件和GO官网的文件内容和格式是一致的,只不过数量上稍有差异。在NCBI检索基因时,在结果页面会看到该基因对应的很多注释信息,其中就包括了GO注释,这些信息在FTP上都提供了源文件,以供下载,链接如下ftp://ftp.ncbi.nih.gov/gene/DATA/几个主要的文件示例如下gene2go就是基因对应的GO注释文件,这个文件包含了所有物种的GO信息,可以根据物种对应的tax id提取指定物种。NCBI中用Entrez Id 标识每个基因,通过另外的几个文件,可以得到Entrez ID, Ensemble Id, Gene Symbol对应的GO信息。对于常见的物种,Bioconductor上也提供了对应的注释包,示意如下以o 香港云主机rg.Hs.eg.db为例,这个R包存储了很多human基因对应的信息,通过keysselect函数可以获得基因对应的GO注释信息,代码如下这里的代码只是根据Entrez ID 得到了GO注释信息,其实这个R包也包含了gene symbol, ensembl id等很多其他的基因ID。许多做富集分析的包就会从物种对应的db包中读取GO注释信息。上述就是小编为大家分享的怎样获取物种所有基因对应的GO注释了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注开发云行业资讯频道。

相关推荐: Hadoop无法解决的问题是什么样的

本篇文章为大家展示了Hadoop无法解决的问题是什么样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。因为项目的需要,学习使用了Hadoop,和所有过热的技术一样,“大数据”、“海量”这类词语在互联网上满天乱飞。Had…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 10/06 16:43
Next 10/06 17:34

相关推荐