科研星球

Oncomine数据库使用指南

Oncomine数据库是生信入门必备数据库,它操作简单,结果可靠,但是Oncomine也有它的缺点,那就是免费版不能下载数据,为了解决这个难题,我们团队基于R语言开发了程序包:oncomineR

oncomineR包中只有1条命令oncomine(),它可以整理Oncomine数据库中的条形图数据、箱图数据、热图数据、meta分析数据、summary数据等几乎所有类型的数据,几乎实现了全垒打!
oncomine()命令只有1个参数mhtml,它可以是一个或者多个文件名,指的是插件save as MHTLM下载的网页内容。



一、安装Save as MHTML插件


oncomineR包需要配合插件Save as MHTML一起使用,所以,首先我们需要先来安装这个插件,以chrome浏览器为例。
在浏览器中打开插件下载链接:https://www.gugeapps.net/webstore/detail/save-as-mhtml-mime-html/djbjejcpegcimjdappppobfhaafbmjpf
点击下载按钮,下载插件压缩文件。

640 (1).png

640.png


解压文件。

640 (3).png

 
打开谷歌浏览器开发者页面。

640 (5).png

640 (4).png


安装插件。

640 (6).png

 
安装成功。

640 (2).png

 

二、安装oncomineR包


oncomineR包并未传到CRAN上,而是传到了github上,所以需要从github上来安装,安装命令如下:

devtools::install_github('yikeshu0611/oncomineR')
oncomineR包的开发使用到了do包,rvest包,xml2包,magrittr包,这些包以及它们的依赖包会在安装oncomineR包的时候一起自动安装。



三、下载Oncomine数据库数据


oncomineR包几乎可以整理oncomine数据的所有类型的数据,使用方法完全相同,这里仅演示条形图数据。例如,我们搜索p53基因在bladder cancer中的表达,点击链接即可进入页面。
现在,我们来下载患者的年龄Age。
① 点击GROUP BY右侧的下拉窗口,选择Age选项。

640 (8).png

 
使用save as MHTML来下载网页数据。

640 (9).png

 
这样年龄(Age)数据就下载下来了,如果你还想下载其他数据,重复上面2个步骤即可。



四、整理单个文件数据


使用oncomineR包中的oncomine()命令来整理。
例如,我们来整理上面的Age数据。


# # 设置工作目录setwd('D:/destopfile/oncomine')  # 调用oncomineR包library(oncomineR)  #整理数据r = oncomine('Age.mhtml') head(r)


640 (7).png



五、整理多个文件数据


多个数据文件的整理方法和单个数据文件的方法是一样的,都是先下载,再整理。
例如,我们要整理性别(Sex)、随访时间(Overall Survival Followup Time)、生存状态(OverallSurvival Status)等其它的数据,并且把这几个数据合并到一起。
首先我们下载这几个数据,并将文件夹分别命名为SexOverall Survival Followup TimeOverall SurvivalStatus;然后再使用oncomine()来整理即可。


# 设置工作目录setwd('D:/destopfile/oncomine')  # 调用oncomineR包library(oncomineR)  #整理数据r = oncomine(c('Overall Survival Followup Time.mhtml',              'Overall Survival Status.mhtml',               'Sex.mhtml')) head(r)


640 (10).png



六、总结


配合save as MHTML插件,可以很方便地下载Oncomine数据库的数据,整理单个数据的时候,LegendValue就是结果,整理多个数据的时候,Legend Value会被文件名替换。


没有账号?