科研星球

组织特异性蛋白相互作用预测数据库IID使用介绍

今天就介绍一个基于特定环境预测相互作用关系的数据库:IID: http://iid.ophid.utoronto.ca/ 。

0.png

背景数据集介绍

由于 IID 要进行组织特异性的相互作用网络。因此就需要收集两个方面的数据

相互作用信息

首先就需要收集蛋白之间的相互作用关系。IID 的相互作用信息主要来自于三个方面:

  1. 收集了十个大型的实验验证的相互作用数据库 (BCI, BIND, BioGRID, DIP, HPRD, I2D, InnateDB, IntAct, MatrixDB, MINT);

  2. 直系蛋白的相互作用信息

  3. 基于多个计算方法来预测相互作用信息 (Rhodes, Nat. Biotech., 2005; Elefsinioti, Mol. Cell Proteomics, 2011; Zhang, Nature, 2012; Kotlyar Nat. Methods, 2015)

组织特异性

为了了解基因在特定组织的特异性,作者利用多个 GEO 公共数据集来分析基因在不同的组织当中的表达情况。例如,作者使用 GSE18290 来分析基因在不同发育阶段的表达情况。

0 (1).png

基于第一部分的结果,可以知道哪两个基因存在相互作用关系。进一步如果这两个基因在某一个组织当中都有一定的表达量,那么就认为这两个基因在这个这个组织当中存在相互作用关系。


数据库使用

在 IID 当中支持多个基因的输入,最多可以输入 1000 个基因。同时 IID 支持三种基因格式:基因名,UniProt ID 以及 Entrez ID。

0 (6).png

在输入想要查看的相互作用之后,首先可以选择相互作用的方式以及实验性证据的最小个数。

0 (2).png

其次如果有想要观察特定组织/疾病的内的相互作用。可以进一步进行选择。这里我们选择在胃癌当中关系相互作用关系。

0 (3).png

输出结果方面,主要是通过表格和网络图的方式来进行展示的。在证据类型当中,也展示了是预测还是实验的结果。

0 (5).png


总的来说

以上就是 IID 的主要使用方法。相较于其他相互作用数据库。IID 主要是增加了关于组织特异性的表达情况的数据。进而确定具体的相互作用蛋白是否在特定组织当中表达。

对于来自于其他的数据库的相互作用信息而言,如果数据不跟随原始数据库实时更新的话,有可能会造成预测信息滞后的情况。例如最近的 IID 下载的 BioGRID 的数据是 2021-04-07。而 BioGRID 几乎每个月都会有一次数据更新。11月份和4月份的数据已经有很大的区别了。

0 (4).png


没有账号?