科研星球

Metascape,大佬们青睐的这款在线功能富集工具

功能富集是组学分析中,研究基因或者蛋白功能必不可少的一个步骤,但是功能富集的工具众多,各个工具难易程度差别较大。


而且可信度也是困扰研究者的一个问题,不知道如何下手,该选择什么样的工具才是合适有效的。

最后就是对结果的可视化,对于非生信学生来说,也是一道拦路虎。

为了解决这些烦恼,师兄决定分享和重点介绍这款无需注册、完全免费的、随时可用的、NCS 大佬们青睐的在线功能富集工具(Metascape),跟着大佬们的步伐总没错。

为了避免「迷路」,首先上网址:http://metascape.org/,先保存收藏吧!

工具名称为 Metascape,关于工具的文章发表在《nature communications》上。


一、为何要使用这款工具?

无论是相比于传统的 GO 在线分析工具,还是 R 语言调用的 GO 分析,Metascape 的最大优点在于可信度高、更新及时、包含数据库全面等,因此才会有大量的文章选择使用它。

根据其网页显示,截止目前,已经有超过 1900 篇 SCI 论文引用或者使用了这个工具,这其中的文章大多数还是主流期刊文章,包括 NCS 及其子刊,可见其受欢迎程度。

0 (2).png
图片来源:网站截图


此外,网站数据库的更新速度也很快,而且加入很多新功能。


0 (1).png

图片来源:网站截


Metascape 也是一款集分析和作图为一体的工具,操作简便,很多 NCS 级别文章更是直接使用了 Metascape 导出的富集结果图片。

0.jpg

图片来源:自己做的



二、具体如何操作?

接下来就一起看看如何操作使用吧。

1、打开网站,首页也很友好,非常简洁。在 Step 1 下,有两种方式选择输入文件。

第一种是将 gene list 以文件的形式上传,也支持 csv、xlsx,txt 等多个文件;第二种方法是直接粘贴 gene list,可以是 ID,也可以是 gene symbol 或者其他的名称。

0.png

图片来源:网站截


2、输入基因之后(示例数据,无任何意义),点击 Submit。然后就会出现 Step 2,选择物种,一定要记得选对。

选择自己输入的基因来源物种,分析的物种,两者保持一致。开始分析的话点击 Step 3 中 Express analysis,则开始默认的分析,包括多个数据库。

0 (8).png

图片来源:网站截


假设我们只需要选择某几个,例如只需要 KEGG,或者 GO 的结果,那么点击 Step 3 中的 Custom analysis,之后点击 Enrichment 进行设置。

在 Pathway & Process enrichment 下设置 P 值等基本阈值,并选择需要富集的过程。

一般使用较多的是 GO 和 KEGG,我们只需要勾选这两个即可,当然,这里还包括其他的功能,例如疾病通路富集,按照分析目的勾选即可。

最后点击左上角 Enrichment Analysis 就开始分析了,等到一会就好了。

0 (4).png

图片来源:网站截


3、分析完成之后,点击黄色的 Analysis Report Page 就可以进入分析结果页面了。

0 (5).png

图片来源:网站截


4、这次演示我们选择了 GO 分析,Metascape 首先呈现的结果是 top20 的 GO terms,Metascape 自动去除了冗余的 terms,简单明了的展示最主要的实验结果,如果要查看所有的富集 terms,下载富集结果 Excel 文件即可。

Metascape 提供的富集可视化形式为柱状图,与常见的呈现结果一样,这个配色其实也挺好看的,不用自己去额外作图了,直接点击 PDF 下载为 PDF 格式,导入 AI 为矢量图进行编辑。

这个图也可以直接用于 SCI 文章。

0 (6).png

再往下,还会有 GO 分析结果的详细列表,count,P 值等信息。

0 (7).png

除了传统的柱状图,Metascape 还提供了一种富集结果的可视化方式,通过富集网络的形式展现,同一种颜色的圈代表一个大类的 terms,小圈代表单独的一条 terms,不同颜色之间相互联系表示 GO 网络关系。

这种形式的结果可以让我们看出或者有利于理解生物学过程或者通路之间的相互关系。

结果可以直接 PDF 下载,或者下载 cys 文件,导入 cytoscape 软件编辑输出,让结果可视化呈现更加好看。

0 (3).png

此外,还有基因或者蛋白相互作用图,结果是基于 STRING 分析的。也可以下载 PDF 或者 cys 文件编辑。

0 (9).png

5、最后是对原始分析结果的导出,包括富集通路包含基因的详细信息。点击 Gene list Report Excel Sheets 可以查看。

0 (10).png

还可以下载 Gene list Report PPT file,打开之后就会发现,Metascape 非常人性化的,在图的下面标注了实验方法、图注的英文版。

这下连写 SCI 的一小部分也被承包了,只需要按照自己的具体情况修改就 OK 了,可以说是很贴心了。

0 (11).png

至此,整个富集分析流程以及结果获取就完成了,是不是特别简单。

结果也可以直接使用,认可度较高。当然了,Metascape 除了功能富集之外,还有其他的一些用途,比如说基因 ID 的转化,能够将我们输入的基因标识符直接转化为对应的 gene ID,用于分析。

其他的一些功能也是需要各需所需,相比于 GO、KEGG 富集,没有这么广泛使用,感兴趣的小伙伴可以自己探索一下。希望这个简单的在线工具可以帮助大家!



没有账号?