科研星球

这个数据库可以分析基因家族,cBioPortal

cBioPortal数据库是探索肿瘤的基因组学特征,是从DNA水平进行的,是对机制的进一步研究。基因差异表达、生存分析和免疫浸润分析,上述分析严格意义上讲均属于表型。免疫浸润分析属于交叉,算是表型式的解释,就是用现象解释现象,但其实并没有涉及具体的机制。


TCGA数据中除包括样本的表达信息、生存分析信息,也包括突变、拷贝数、甲基化以及临床信息等数据,因此可用于多组学的交叉分析。今天,我们分享TCGA多组学分析的神器,肿瘤基因组学分析的神器——cBioPortal,不需要注册,登录即可免费使用:


cBioPortal(https://www.cbioportal.org/)


下载.jpeg

cBioPortal网站目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据等,可以快速获取大规模癌症基因组学项目的分子谱和临床预后相关性,并将这些丰富的数据集转化为可视化数据以用于临床。


首先登陆cBioPortal官方网站http://www.cbioportal.org/。

下载 (1).jpeg


以乳腺癌为例,分析E2F基因家族基因突变在乳腺癌发生中的作用。选择权威的数据库,比如TCGA数据库的数据,勾选好。再点击Query by gene

下载 (2).jpeg


出现下图,输入基因名称,点击submit query。

下载 (3).jpeg


出现分析结果图。

下载 (4).jpeg


也可以查看肿瘤类型总结。

下载 (5).jpeg


还可以进行生存分析,但是分析出的结果往往没有差异,所以不推荐使用。

下载 (6).jpeg


这里涉及一个概念——肿瘤突变负荷(tumor mutational burden,TMB)。TMB是指正常等位基因(A)突变成等位基因(a),在选择上不利的纯合体(aa)所引起群体适应度下降的现象。

下载 (7).jpeg


在肿瘤研究中,TMB被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。

下载 (8).jpeg


量化的描述TMB,可分为4类,与肿瘤免疫治疗关系密切。

1. TMB-High=>20mutations/Mb;

2. TMB-Intermediate, 6-19 Muts/Mb;

3. TMB-Low <= 5 Muts/Mb;

4. TMB-Unknown, if the sample is not of sufficient quality to confidently determine Tumor Mutation Burden.


上述图还可以进一步通过PPT编辑,转换成文章中用图。


以上几个功能是cbioportal的重要功能,当然还有很多小功能,如查询基因在肿瘤中突变类型的总结分析、点图展示、突变基因的enrichment分析和基因突变数据下载等等,分析结果可直接应用于发表paper,但是需要引用(网站有介绍)。


没有账号?