KOBAS(KEGG Orthology Based Annotation System),网址:http://kobas.cbi.pku.edu.cn,是由北京大学魏文丽课题组开发的数据库,主要功能是用于基因/蛋白质功能注释和功能富集。随着数据量不断增加,KOBAS至今为止共经历了3次升级,除了1.0版本的KEGG代谢通路之外,2.0版本增加了PID Curated,PID BioCarta,PID Reactome,BioCyc,Reactome和Panther等数据库,除此之外还增加了疾病的查询,使得KOBAS的功能更加强大。而3.0版本更是增加了lncRNA的鉴定、注释以及富集功能,还建立GSEA,GSA和 PADOG等功能。
KOBAS的功能最主要分为两个部分,Annotate(注释)和Enrichment(富集)。
接下来我们就以“Annotate”为例来体验看看如何利用KOBAS做GO和KEGG的富集分析吧!
点击“Annotate”选项,进入注释界面。
“Species”为物种,可根据自己测序组织来源进行选择,如人,大鼠,小鼠等。
“Input Type”为输入格式/类型,支持如图Fasta Protein Sequence,Gene Symbol等七种格式,可根据自己的输入数据进行选择。
输入数据后,点击“Run”进行提交,等待数秒即可出结果。
得到注释结果,如下图所示,点击“Detail”可查看基因注释的Pathway通路、疾病及GO功能分类。注释结果下方还提供链接进行结果下载哦。
点击第二列“KEGG Gene ID”可以直接链接到KEGG数据库查看具体信息。
点击第三列“Disease”中“Detail”注释结果如下所示,可具体了解与差异表达基因相关的疾病信息哦~
“Gene-list Enrichment”部分,“Input Type”, “Species”及“Input”与注释时基本一致。
“Datebase”中可选择自己感兴趣的数据库进行分析。
“Advance Options”中可自行选择参数,包括背景基因、统计学方法及校正方法等。
与“Annotate”一样,设置好所有参数后,点击“Run”,等待数秒即可得到分析结果哦,且结果都可进行下载,方便又快捷。
此外,KOBAS除在线使用外,还可将下载到本地,具体可点击官网菜单栏“Download”进行详细了解哦,在此不做详细介绍啦。
总之,KOBAS不仅仅可以得到GO和KEGG富集分析结果,还可以了解与之相关的疾病信息。学习了这么多,赶紧把你手中筛选到的差异基因操作分析起来吧,说不定马上就会得到意想不到的结果