科研星球

Nature | 通过网络推理和计算机基因扰动分析细胞身份

近日,美国华盛顿大学圣路易斯分校医学院的Samantha A. Morris研究组在Nature杂志上发表了文章Dissecting cell identity via network inference and in silico gene perturbation利用单细胞多组学数据获取的基因调控网络进行计算机模拟转录因子扰动,使用未扰动的数据模拟细胞身份变化,开发出一种可以预测细胞身份随发育调节因子转变的计算机模拟方法CellOracle。


0.png

CellOracle使用定制化的GRN模型模拟敲除或过表达转录因子(TF)时基因表达的下游变化,将模拟值转化为细胞身份转换的矢量图,从而在低维空间可视化地观察模拟的细胞身份变化(图1)。模拟扰动涉及4步:使用线性回归进行细胞类型或状态特异的GRN配置、使用这些GRN模型计算响应TF扰动的靶基因表达变化、估计细胞身份转换概率、将转换概率转化为加权局部平均向量以代表每个细胞受扰动后细胞状态的转换方向——如此可将细胞身份变化的模拟结果以二维向量呈现出来。

0 (1).png
图1 响应TF扰动的细胞状态转换的模拟

为确保支持响应TF扰动的信号传播,作者开发出定制化的GRN模型:首先使用单细胞染色质可及性(scATAT-seq)数据合并启动子和增强子区域,包括近端和远端的调节元件。随后扫描这些元件的序列确认TF结合基序,产生包含所有潜在调节互作的基础GRN结构。接着使用scRNA-seq数据发现基础GRN中的活跃连接,生成细胞型别或状态特异性的GRN配置。这里作者构建机器学习模型用于预测TF表达基础上的目标基因表达情况。由于CellOracle使用基因组序列和信息推测基础GRN的结构和方向性,不涉及因果关系,作者认为使用相对简单的正则化线性机器学习模型进行GRN推理即可实现模拟TF扰动的信号传播。此外,作者还对GRN推理方法进行基准测试,以确认方法的准确性。结合信号传播策略,CellOracle可通过计算机模拟扰动有效分析调控网络生物学和细胞身份动态变化。

接着,作者尝试通过GRN分析进行小鼠造血的TF调节重现,以验证其可靠性。作者选用2730个骨髓前体细胞分化的scRNA-seq数据【4】进行CellOracle分析,分别构建24种骨髓细胞聚类的GRN模型,并尝试重现TF调节后的细胞身份变化。作者确认CellOracle可准确模拟由Gata1Spil主导的髓系谱系转化,尽管存在个别遗漏。扩大范围,CellOracle仍可准确重现小鼠和人源造血作用中的敲除表型。接着,作者证明CellORacle可以模拟多种特定基因敲除后的细胞分化状态。因此,CellOracle可有效模拟细胞状态特异的转录因子功能,重现已知的造血过程中的细胞命运调节机制,敲除实验显示其可客观、批量地进行基因扰动计算机分析。

下一步尝试使用CellOracle对斑马鱼胚胎发育中的转录因子进行模拟系统扰动,使用的是此前发表的斑马鱼胚胎发育图谱【5】,推断各种细胞类型和状态下的GRN配置。作者首先构建一个基础GRN,而后通过敲除实验模拟推测有关联的转录因子,创建识别早期斑马鱼发育的调节因子的有价值资源。此后作者聚焦在轴向中胚层分化,对232个候选TF进行系统性敲除模拟和网络分析。此外,CellOracle还确认转录因子noto为脊索发育过程中的关键调控因子,验证了此方法的准确性。紧接着通过对noto进行功能丧失突变,作者验证其推测,发现脊索前板会扩张。突变体实验显示标记为脊索的细胞显著减少,而脊柱旁簇扩张,同时伴随着脊索前板簇的扩张。此外作者还使用CRISPR-Cas9对结论进行验证。

最后,作者试图发现新的轴性中胚层分化相关转录因子。通过优先级排序,重点关注明确的谱系特征出现之前的早期分化,得到的排名靠前列表中包含数个已知的脊索调节因子,如noto,从而证实CellOracle可模拟已知的发育调控能力。作者还发现了此前分析中被过滤掉的因子,且排名前30的转录因子中超过80%与躯借分化相关;此外也发现一些未曾报道功能的转录因子,选择其中三个lhx1aseboxir3a,使用CellOracle预测它们LOF后会影响脊索分化,分别在小鼠体内进行验证并进行初步的单细胞分析。总之,上述结果说明CellOracle可精确预测已知转录因子扰动的表型,可深入了解先前表征的突变体,并揭示经过充分研究的模式生物中已建立发育过程的调节因子。

回顾全文,作者开发出一种机器学习方法CellOracle,适用于小鼠和人的造血、斑马鱼胚胎生成,可正确模拟已报道的由于转录因子扰动而产生的表型变化。通过对发育中的斑马鱼进行系统性的基因锁转录因子扰动,模拟并证实由于noto基因缺失产生的一种全新表型。作者还鉴定出一种轴向中胚层调节子lhx1a。该方法可用于分析转录因子对细胞身份的调节,并为发育和分化提供机制分析。CellOracle的代码已经公布(https://github.com/morris-lab/CellOracle),其研究数据可在链接中获得:https://celloracle.org,感兴趣的读者可以自行下载分析。

同期,Nature配发新闻&观点文章An oracle predicts regulators of cell identity介绍本文基本情况,并积极预测CellOracle类型方法将助力对细胞身份调控的认识,同时提醒研究者注意,“正如希腊神话故事中阿波罗不得不杀死蟒蛇(python)来建立起他的神示所,你也必需征服Python(脚本语言)才能使用CellOracle”。

0 (2).png

原文链接:
https://doi.org/10.1038/s41586-022-05688-9


没有账号?