心肌梗死专科治疗医院

首页 » 常识 » 常识 » scGEMA基于单细胞多组学增强子的基因
TUhjnbcbe - 2023/8/27 21:46:00
北京治皮炎好的医院 http://m.39.net/pf/a_9052592.html

1

简介

单细胞RNA测序(scRNA-seq)和ATAC-seq(scATAC-seq),通过捕获正交分子信息,即scRNA-seq的基因表达和scATAC-seq的调控元件和转录因子(TF)的活性,为在单细胞水平上理解基因调控提供了前所未有的机会。

目前,有两种计算工具,Pando和CellOracle,可用于基于单细胞多组学数据的GRN推断。然而,Pando侧重于识别仅限于TF-TF相互作用的调节网络,不提供模态整合或轨迹分析的方法。CellOracle需要首先基于参考scATAC-seq数据组装基本GRN结构,并且需要对scRNA-seq和scATAC序列分析进行几个预处理步骤,这也在一定程度上限制了CellOracle的使用。

因此,作者开发了scMEGA作为一个通用框架,通过将单细胞多组学特征作为输入来定量推断GRN。scMEGA支持对用于GRN推断的多组学数据进行端到端分析,包括模式整合、轨迹分析、增强子-启动子关联以及网络分析和可视化(图1)。scMEGA提供了新的功能,并结合了Seurat、ArchR、chromVAR和igraph等一些现有方法。ScMEGA可以通过R包实现,可以处理Seurat对象,可以与Seurat兼容。

图1scMEGA概况

2

结果

scMEGA识别肌成纤维细胞分化的重要调节因子

作者整合了snRNA测序和snATAC测序数据,并鉴定了四个成纤维细胞亚群(补充图1a)。标记基因的检测表明,簇2高度表达SCARA5,根据最近的研究,其作为人类肾脏中肌成纤维细胞祖细胞的标记。簇1由POSTN、COL1A1和COL3A1标记,表明这些细胞是分化的肌成纤维细胞。基于这些,作者构建了从簇2到簇1的伪时间轨迹,以研究肌成纤维细胞分化过程。

接下来,作者选择了79个候选TF和个基因,用作推断GRN的输入。候选TFs的结合活性和候选基因的表达之间的相关性揭示了两个主要调节模块,每个模块对应于不同的成纤维细胞亚群。推断网络的可视化精确定位了肌成纤维细胞分化的调节因子(图2a)。例如,作者确定NR3C2是SCARA5+成纤维细胞(模块1-成纤维细胞祖细胞)的调节因子。NR3C2在临床上是阻止心力衰竭纤维化进展的重要靶点,作者观察到NR3C2的结合活性、TF表达和靶基因表达沿轨迹下降(图2b)。关于肌成纤维细胞,作者检测到一些纤维化相关TF,如TEAD和RUNX家族基因(图2b)。

作为EGRN下游特征的一个例子,作者提取了NR3C2和RUNX1的靶基因(调控体),并检查了TFs及其调控体在空间中的表达(图2c)。由于空间转录组学中这些TF的稀疏性和低表达值,作者无法检测到空间中TF的清晰表达模式(图2d)。通过探索NR3C2和RUNX1的调控体(靶基因),作者观察到在纤维化反应的定义心脏区域的梯度和互斥空间表达,突出了scMEGA在稀疏空间转录组学数据中描绘TF调控体表达的能力。

图2肌成纤维细胞分化的案例研究

3

总结与讨论

在这项工作中,作者提出了scMEGA,这是一个综合性的、方便使用的分析框架,通过使用单细胞多组学数据作为输入来推断基于增强子的GRN。scMEGA基于几个流行的R包(如Seurat、Signac和ArchR)构建,用于单细胞数据分析。它使用户能够进行端到端的GRN推断,并对重要的TF和基因进行优先排序,以进行实验验证,并且可以用于空间转录组学的分析。作者举例说明了scMEGA在心肌梗死后人心脏成纤维细胞中的应用。scMEGA是一个重要且独特的框架,用于从单细胞多组学数据中了解各种生物过程的复杂基因调控机制。

参考资料

ZhijianLi,JamesSNagai,ChristophKuppe,RafaelKramann,IvanGCostabioRxiv.08.10.;doi:

1
查看完整版本: scGEMA基于单细胞多组学增强子的基因