浙江大学范骁辉教授团队《自然∙通讯》:从空间组学数据中识别和表征细胞生态位
时间:2025-02-20 12:11:55 热度:37.1℃ 作者:网络
细胞生态位(cell niche),也被称为细胞微环境或空间域,指的是围绕细胞的局部环境或细胞群落,在决定多种生物过程方面起着至关重要的作用。解析组织中的细胞生态位对于理解药物(包括中药)的作用机制非常关键。空间组学技术的最新进展提供了单细胞且空间分辨的分子图谱,使得在组织背景下系统地探索细胞状态、功能及相互作用成为可能。然而,尽管这些技术提供了丰富的数据资源,如何准确解读已有数据中潜在的细胞生态位信息依然是一项巨大挑战。
浙江大学药学院、现代中药创制全国重点实验室范骁辉教授团队联合四川省中医药转化医学中心华桦研究员团队针对上述瓶颈,开发了一种基于深度学习的计算方法scNiche,为从空间组学数据中解析潜在的细胞生态位信息提供了全新的计算工具和分析框架。2025年2月16日,相关研究成果以“Identification and characterization of cell niches in tissue from spatial omics data at single-cell resolution”为题发表于Nature子刊《Nature Communications》上。
scNiche通过利用和整合细胞自身及其微环境的多“视图”特征来识别细胞生态位。默认情况下,scNiche以空间组学数据作为输入,首先在预定义邻域范围内提取每个细胞的以下三个视图的特征:细胞的分子表达谱、邻域的分子表达谱和邻域的细胞组成。随后,scNiche采用多视图图自动编码器(multiple graph autoencoder,M-GAE)与图融合网络(graph fusion network,GFN)相结合的神经网络架构,将细胞的多视图特征整合为一个生态位联合表示。此外,scNiche还应用了一个多视图互信息最大化(multi-view mutual information maximization,MMIM)模块,通过提高任意视图内相邻样本表示间的相似性来引导模型学习更具判别性的联合表示。训练过程以最小化由M-GAE重构、图重构和互信息损失组成的联合损失函数为指导。scNiche还设计了一种批量训练策略,使其能够高效拓展至大型数据集。模型训练完成后,可使用任一无监督聚类算法(如k-means或Leiden)对学习到的联合表示进行聚类,以识别细胞生态位。最后,scNiche还实现了一个集成的下游分析框架,用于对已识别到的各细胞生态位进行综合表征、解释和比较。
图1 scNiche工作流程及下游分析框架示意图
研究团队首先在多套模拟或真实数据集(涵盖不同复杂程度的生态位结构)上系统评估了scNiche与其他相关方法在细胞生态位识别方面的表现。结果表明,scNiche在不同数据集上的整体表现优于其他所有方法,最为准确地解析了不同组织中的细胞生态位结构。
图2 scNiche与其他相关方法在具有不同生态位结构的真实数据集上的性能比较
研究团队随后进一步在一套包含129个组织切片、超过300万个细胞的小鼠全脑大型空间转录组数据集上测试了scNiche与其他方法的可拓展性。结果表明,scNiche的批量训练策略能够高效拓展至大型数据集,并且,相比于其他可拓展方法,scNiche识别的各细胞生态位与小鼠大脑中已知的不同结构之间的对应关系更为准确。
图3 scNiche与其他相关方法在小鼠全脑大型空间转录组数据集上的性能比较
为了证明方法的实用性,研究团队进一步运用scNiche分析了小鼠肝脏正常样本和肝损伤样本的空间转录组数据。结果表明,scNiche不仅精确解析了正常肝脏的分区特征,同时有效识别了富集于肝损伤样本、与肝损伤相关的特定微环境。此外,scNiche还揭示了肝损伤过程中细胞生态位从中央静脉到门脉节点分区模式的部分重塑,突显了scNiche在识别和表征不同生理病理状态下组织中细胞生态位转变方面的高精度。
图4 利用scNiche识别、表征和比较小鼠正常样本和肝损伤样本中的细胞生态位
综上所述,本研究提出了一种名为scNiche的计算方法,用于从空间组学数据中识别和表征细胞生态位。相比于现有的基于深度学习的相关方法,scNiche采用独特的图神经网络利用方式提取并融合细胞的多视图特征,为细胞生态位建模提供了更大的灵活性,同时在不同空间组学数据集上表现出更优秀的性能。此外,scNiche能高效拓展至包含多个切片样本的大型数据集,并提供了一个集成的下游分析框架,能够分析和比较不同样本或生理病理状态下组织中细胞生态位的差异及转变,展现出巨大的生物医学应用潜力。scNiche算法现已开源至GitHub平台(https://github.com/ZJUFanLab/scNiche)。
本文第一作者为浙江大学药学院博士生钱竞扬和包胡栋、长三角智慧绿洲创新中心“百人计划”研究员邵鑫。浙江大学药学院教授、长三角智慧绿洲创新中心主任、现代中药创制全国重点实验室副主任范骁辉教授、四川省中医药转化医学中心华桦研究员和浙江大学长三角智慧绿洲创新中心未来健康实验室、现代中药创制全国重点实验室邵鑫研究员为本文的共同通讯作者。本课题受到国家自然科学基金、浙江省“尖兵”“领雁”等项目的支持。浙江大学长三角智慧绿洲创新中心高性能计算集群为本课题提供了算力支持。
原文链接: