科研星球

KRAB ZNF explorer,高分生信必备的TCGA数据库一站式分析神器!介绍及使用教程

癌症基因组图谱(The Cancer Genome Atlas,TCGA)早已在全世界广为知晓,这项计划包含了人类全部癌症的基因组变异图谱,通过数据挖掘能够很好地了解癌症发生和发展的机制,是肿瘤研究中重要的数据库。然而,因为其数据集规模较大,复杂度较高,下载数据进行分析困难较多,很多小伙伴在下载TCGA数据时就因为诸多因素而无从下手。于是,GEPIA等基于TCGA数据库的可视化网络平台给我们带了极大的便利,能够简单快速的预测或分析绘图。今天我又为大家带来一款2020年最新的基于TCGA数据库的网络分析工具——KRAB ZNF explorer(http://mi2.mini.pw.edu.pl:8080/KRAB_ZNF/

下载.jpeg


这款工具是发表于今年2月的生信老牌期刊Bioinformatics,2019年最新影响因子5.61。题名为“KRAB ZNF explorer(KRAB ZNF explorer – the online tool for the exploration of the tranomic profiles of KRAB-ZNF factors in The Cancer Genome Atlas)”。作者是波兰首都华沙大学的Cylwa,Biecek等人。


下载 (1).jpeg


背景知识


KRAB-ZNFs(Krüppel-associated box domain zinc finger proteins):是最大的锌指蛋白家族,也是最大的表观遗传抑制剂。这些蛋白在细胞信号转导、细胞生长、分化中起到重要作用。KRAB-ZNFs家族中的一些成员也参与癌症的发生发展。然而,大多数krabb - znf因子的功能仍不清楚或缺乏特征。KRAB-ZNFs参与癌症发展,因此可能支持未来探索krabi - znf作为生物标志物或抗癌靶点在患者管理机制中的功能和潜在效用的研究。


640.png

这个平台收录了381种KRAB-ZNF在30多种TCGA癌症中的功能,揭示KRAB-ZNF家族因子参与癌症的新的线索,能够进行的主要分析包括:


1)正常和肿瘤样品之间KRAB-ZNF基因的比较分析;

2)KRAB-ZNF表达与各种临床病理参数的相关性;

3)患者存活率与KRAB-ZNF基因表达之间的联系的分析和可视化;

4)分析KRAB-ZNF表达与CpG甲基化状态之间的关系;

5)分析正常和肿瘤样品中KRAB-ZNF基因的同工型表达;

6)正常组织中KRAB-ZNF表达的比较分析


下面我们就来逐一展示这个神器的各种功能吧。




操作演示


正常组织和癌症组织KRAB-ZNF表达的比较分析


“Expression in Normal vs Tumor” 分析模块使用的是标准化的RNA-seq数据,使用错误发现率(FDR)校正的Student t检验,可以在癌症和正常组织之间进行差异表达分析。 用户可以从 数据可以可视化为箱线图。 此外,还会生成带有所需比较的t检验结果的表格,并可以下载该表格。首先我们点击“Expression in Normal vs Tumor”,接下来在页面左边,选择感兴趣的KRAB-ZNF因子和癌症类型。我们以ZNF195在LUSC中的表达为例,设定相应参数。网页自动运行,界面右方会得到结果图片和数据,下拉页面可以下载tiff, pdf, eps三种格式图片,以及csv, txt格式数据。


下载 (2).jpeg


KRAB-ZNF表达与各种临床病理参数的相关性


“Clinical Parameters”模块可以显示所选KRAB-ZNF因子与不同临床参数之间的相关性。同样使用带有FDR校正功能的Student t检验来评估独立亚组在临床变量和分子参数方面的差异。并通过箱式图和带有t检验结果的列表展示相应结果。该模块有助于了解所选肿瘤的不同组织学类型之间基因表达的差异。如果某些类型与显着的低基因表达或高基因表达有关,那么相应的箱形图将发生变化。每个箱线图显示中位数和四分位数表达(框的边界),最小和最大表达以及离群值。 结果箱式图比较了所选亚型中所选基因的表达水平。底部表格显示了相同比较的描述性统计数据和t检验结果。


我们仍以LUSC cohort,ZNF195基因为例,在肿瘤亚组“subtype”一栏,有“expression subtype”, “gender”, “histological type”, “smoking history”,“pathologic M” , “pathologic T”, “pathologic N” 等亚组分类可以选择。然后设置linear scale 或者log scale, 以及对scale minimum ,font size进行设定,就可以在界面右边得到可供下载的结果图片和数据。


下载 (3).jpeg


生存分析


“Survival Analysis”模块是生存分析,提供了以下三个分析模式。


下载 (4).jpeg


可以比较每个KRAB-ZNF在高表达和低表达组之间的个体存活率。我们可以通过表达中位值,或者使用最大选择的等级统计信息来确定分割的最佳切割点,这两种方式选择分类为高或低表达水平。并通过最大秩统计和对数秩检验的p值热图可视化切割点选择,比较各组之间的生存分布。除了绘图外,它还提供可下载的表格以及对数排名的测试结果。 使用survminer软件包进行生存分析,绘制Kaplan-Meier曲线。并可以各种格式下载并具有其他可自定义功能。我们以基因KRBA2在LUSC队列中的生存分析为例,并以系统默认参数进行设定,在界面右边出现Kaplan-Meier曲线以及基因表达的分布。可以下载png, pdf, eps, tiff四种格式。另外还可以绘制所选基因热图;生成log-rank检验表格。


下载 (5).jpeg


下载 (6).jpeg


KRAB-ZNF表达与DNA甲基化的相关性


在“Methylation and Expression”模块中,我们可以分析KRAB-ZNF表达与CpG甲基化之间的相关性。分析使用了t检验以评估两组患者之间每个CpG岛的甲基化差异。 将患者以每个KRAB-ZNF和癌症队列中最高(最高10%)和最低(最低10%)表达水平分组。同样可下载结果表格。列表显示了针对每个队列进行的KRAB-ZNF因子高表达(前10%)和低表达(下10%)组之间甲基化水平差异的t-检验(p值经过FDR调整)的结果,并与基因分开。这里有可能很耗时,因为系统需要处理所有的CpG岛。


下载 (7).jpeg


KRAB-ZNF异构体分析


在“Isoforms Expression”模块中,通过以下方式分析同工型表达。首先,对于每个队列,可以分别生成一张表格,其中t检验的结果分析了正常组织和癌组织之间同工型表达的差异。 其次,对于选定的队列和基因,用户可以查看并下载显示每个同工型表达谱的箱线图。 第三,可以绘制所选基因和同类人群中同工型表达的百分比。 最后,该应用程序会生成所有同类群组的同工型表达图。

下载 (8).jpeg

我们点击“Isoforms expression normal vs cancer test”,选择目的基因合癌症类型后,点击“Generate output”首先可以生成每个队列中正常组织和肿瘤组织异构体表达t检验的结果表格,如下图所示。

下载 (9).jpeg

另外,对于选中的队列和基因,用户可以下载每个异构体的表达箱式图,显示了正常和癌症组织中所选基因同工型的表达差异。通过箱式图有助于了解哪些异构体表达不同。

下载 (10).jpeg

此外,还可以绘制异构体在选中的基因和队列中的表达百分比,也可以绘制在所有队列中的表达条形图。

下载 (11).jpeg

KRAB-ZNF在正常组织中的对比分析


在“Expression in Normal Tissue”模块中,可以选择一系列KRAB-ZNF因子,绘制在所有正常组织中的表达热图,以及基因表达的箱线图,和下载相关的统计数据。有助于了解多个基因(行)在不同的肿瘤(列)中差异表达。

下载 (12).jpeg




小结


该项分析平台相比于其他如GEPIA等基于TCGA数据库的泛癌研究平台来讲,更专注于KRAB-ZNFs家族的300多基因,分析的也更加深入,功能及数据下载也比较全面,对于研究KRAB ZNFs这个最大的表观遗传抑制剂家族提供了很好的分析方式。同时,构建此类针对部分基因的数据库,在分析结果上相对更加垂直,也为我们创造更多的生信挖掘工具提供了很好的思路和方向。该项研究将使KRAB-ZNFs家族在癌症和癌症相关表观遗传学机制中的作用得到更全面的表征。




参考文献

[1] Cylwa Rafał,Kiełczewski Kornel,Machnik Marta et al. KRAB ZNF explorer-the online tool for the exploration of the tranomic profiles of KRAB-ZNF factors in The Cancer Genome Atlas.[J] .Bioinformatics, 2020, 36: 980-981.

[2] Marcin Kosinski and Przemyslaw Biecek (2019). RTCGA: The Cancer Genome Atlas Data Integration. R package version 1.14.0. https://rtcga.github.io/RTCGA

[3] Marta Machnik, Rafal Cylwa, Kornel Kielczewski, Przemyslaw Biecek, Triantafillos Liloglou, Andrzej Mackiewicz, and Urszula Oleksiewicz (2019). The expression signature of cancer-associated KRAB-ZNF factors identified in TCGA pan-cancer transcriptomic data.. Mol Oncol. 2019 Apr;13(4):701-724. doi: 10.1002/1878-0261.12407.





没有账号?