AI在线 AI在线

突破性进展!浙大scNiche框架精准识别细胞生态位,助力精准医疗

编辑 | 2049随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。 然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。 近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。

图片

编辑 | 2049

随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。

然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。

近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。

该研究以「Identification and characterization of cell niches in tissue from spatial omics data at single-cell resolution」为题,发表于 2025 年 2 月 16 日的《Nature Communications》。

图片

论文链接:https://www.nature.com/articles/s41467-025-57029-9

代码地址:https://github.com/ZJUFanLab/scNiche

研究背景

当前空间组学技术虽能获取单细胞分辨率的分子图谱,但现有计算方法多基于同质性假设,难以捕捉细胞微环境中的异质性特征。

传统方法如 HMRF 和 BayesSpace 采用 Potts 模型强制邻近细胞共享相同标签,这种简化处理导致肿瘤-免疫界面等复杂微环境识别困难。BASS 等改进方法虽引入层次模型,但在多样本整合和大规模数据处理上仍显不足。

研究团队发现,细胞自身分子特征、邻域分子特征和细胞组成特征这三个视角的信息互补性,为克服现有方法的不足提供了新思路。

scNiche框架的三维解析

scNiche 框架采用了独特的设计理念,将细胞本身及其微环境的各种特征统一定义为细胞的不同「视角」特征。具体来说,scNiche 默认在预定义的 k-nearest neighbors 范围内提取三类特征:细胞的分子表达谱、其邻域的分子表达谱以及邻域的细胞组成。

与之前大多数深度学习方法不同,scNiche 首先为不同视角的特征构建独立的图网络,然后利用图神经网络将这些多视角特征整合成一个有意义的联合表示。

这种模型架构包含三个关键组件:多图自编码器(M-GAE)、图融合网络(GFN)和多视图互信息最大化(MMIM)模块。

M-GAE 模型基于图卷积网络(GCN)构建,通过视图特定的 GCN 编码器层编码多视图数据的互补信息,GFN 捕获不同视图图之间的关系并生成包含所有视图全局节点关系的一致性图。

MMIM 模块通过提升任意视角中相邻样本表示之间的相似性来引导更适合聚类的联合表示学习。该模块采用了基于 Shannon 熵的互信息度量方法,通过最大化样本与其近邻的互信息来增强模型对细胞微环境结构的识别能力。

图片

图示:scNiche 概览。(来源:论文)

性能验证

scNiche 的扩展性通过包含 3,698,530 个细胞的小鼠全脑 MERFISH 数据集得到验证。

得益于其创新的 subgraph-based batch training strategy(通过随机采样构建子图进行分批次训练),该方法能够准确识别包括丘脑-纹状体边界在内的不同脑区结构。

在基准测试中,scNiche 在空间蛋白质组学数据集(CODEX、IMC)和空间转录组数据集(STARmap、MERFISH)上均实现了最高的 adjusted Rand index (ARI) 和 macro-F1 分数,显著优于现有方法。

在 10X Visium 数据分析中,即使用 Cell2location 的反卷积结果替代原始细胞组成特征,模型仍保持较好的表现。

在基因表达随机归零的鲁棒性测试中,scNiche 在低 dropout 率时表现相对稳定,但当 dropout 率较高时,所有方法(包括 scNiche)的性能都会显著下降。

图片

图示:小鼠全脑 MERFISH 数据集的性能评估。(来源:论文)

临床应用

在 19 例混合型与 15 例区室化三阴性乳腺癌样本中,scNiche 揭示了独特的免疫微地理特征。

Niche 6 中巨噬细胞高表达 CD11b(p=0.011)和 PD-L1(p=0.016)等免疫调节蛋白,形成免疫抑制微环境;而 Niche 12 中的巨噬细胞呈现出与肿瘤细胞的高度共定位特征(proportion=0.67, p=0.002)。

研究发现 Keratin+ 肿瘤细胞在 Niche 5 与 Niche 11 呈现差异化分布:前者 CK17 表达显著高于后者(p=0.014),且特异性富集于不同患者群体,这为个体化治疗提供了潜在靶点。

图片

图示:乳腺癌微环境解析。(来源:论文)

在肝损伤研究中,scNiche 发现与正常肝脏门静脉周围区域(Niche 1)相比,肝损伤组织中的 Niche 10 显著上调了多个抗氧化基因(如 Gpx3、Gsta1、Gsta2、Gsto1)以及组织纤维化相关基因(如 Ctsl、Ctsb 等 cathepsins 编码基因),揭示了肝损伤微环境的适应性分子特征。

图片

图示:疾病特异性肝损伤的微环境。(来源:论文)

未来展望

scNiche 通过创新的多视角融合架构,在保持单细胞分辨率的同时,实现了跨样本、跨条件的微环境对比分析。其在肝损伤研究中揭示的 zonation 模式重构现象,为器官纤维化机制研究提供了新视角。

但需注意,对于低分辨率的空间转录组数据,微环境解析精度可能受限。未来研究方向包括:整合组织学图像特征以提升空间分辨率、结合单细胞空间映射(如 Tangram、CytoSPACE)或重建技术扩展应用场景,以及开发统一的空间多组学数据解析框架。

相关资讯

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙
8/1/2024 4:06:00 PM
ScienceAI

比原始分辨率高36倍,北航、清华团队用AI在多空间组学平台上高分辨率表征组织,登Nature子刊

编辑 | 萝卜皮空间组学的最新进展已将分子类别分析的范围扩展到转录组学之外。然而,许多此类技术都受到空间分辨率的限制,阻碍了科学家深入表征复杂组织结构的能力。现有的计算方法主要侧重于转录组学数据的分辨率增强,缺乏针对各种组学类型的新兴空间组学技术的适应性。在这里,北京航空航天大学和清华大学的研究人员提出了 soScope,这是一个统一的生成框架,旨在提高从各种空间组学技术获得的分子谱的数据质量和空间分辨率。soScope 可以汇总来自组学、空间关系和图像的多模态组织信息,并通过分布先验与组学特定建模联合推断出具有增
8/14/2024 4:32:00 PM
ScienceAI

AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

编辑 | 白菜叶OpenAI o1 的突破凸显了通过增强推理能力来提高自然语言大模型(LLM)的应用潜力。 然而,大多数推理研究都集中在数学任务上,而医学等领域尚未得到充分探索。 医学领域虽然不同于数学,但鉴于医疗保健的高标准,它也需要强大的推理能力来提供可靠的答案。
1/7/2025 2:51:00 PM
ScienceAI
  • 1