AI在线 AI在线

仅凭一次快照推断细胞动力学,多阶段最优传输模型重建细胞分化轨迹

编辑丨&在单细胞生物学中,一个几乎无法回避的事实是:我们测到的,永远只是某一时刻的细胞状态。 无论是单细胞 RNA 测序(scRNA-seq),还是其他高通量手段,细胞一旦被测量就被破坏。 研究者看到的是成千上万个细胞在某一瞬间的基因表达「照片」,而不是它们如何一步步走向不同命运的过程。
图片

编辑丨&

在单细胞生物学中,一个几乎无法回避的事实是:我们测到的,永远只是某一时刻的细胞状态。

无论是单细胞 RNA 测序(scRNA-seq),还是其他高通量手段,细胞一旦被测量就被破坏。研究者看到的是成千上万个细胞在某一瞬间的基因表达「照片」,而不是它们如何一步步走向不同命运的过程。然而,理解细胞如何分化、在何处分叉、何时做出命运决定,正是发育生物学、再生医学与疾病研究的核心问题。

关于这个问题,卡罗林斯卡学院(Karolinska Institutet)与皇家理工学院(KTH)的研究人员开发了一种算法:Multistage Optimal Transport(MultistageOT),它展示了一种此前未被系统实现的能力:仅凭一次静态单细胞快照,在数学上推断出细胞分化的连续动力学轨迹。

相关的研究内容以「MultistageOT: Multistage optimal transport infers trajectories from a snapshot of single-cell data」为题,发表在 PNAS。

图片

论文链接:https://www.pnas.org/doi/10.1073/pnas.2516046122

多阶段最优传输

细胞分化是体内的一个基本过程。它使干细胞能够发育成不同类型的细胞,例如大脑中的神经元或防御感染的免疫细胞。当这个过程被破坏的时候,就有可能会导致各种疾病,研究这个过程相当困难。

而新算法 MultistageOT,它基于称为最优传输的数学原理,可以从细胞基因表达水平的单个快照中重建整个发育过程。这使得研究者能模拟整个发育过程,而不是局限在一个快照的范围之内。

图片

图 1:MultistageOT 沿着伪时间轴对模拟快照数据进行排序,并在数据点之间诱导状态转换概率。

团队将整个发育或分化过程划分为一系列潜在的中间阶段(latent stages),即便实验上只观测到一个时间点。  然后,他们假设:

细胞群体在这些阶段之间的转移,遵循一种最小「代价」的传输规律。

这里用到的核心数学工具是最优传输(Optimal Transport, OT) ——一种描述「如何以最小代价把一个分布变成另一个分布」的理论。

与传统的 OT 仅限在两个时间点之间,MultistageOT 则在没有任何时间标签的前提下,引入多个隐含中间分布;通过联合优化,同时推断:

  • 中间阶段的存在形式

  • 每个细胞在不同阶段中的概率归属

  • 以及跨阶段的转移关系

预测细胞如何成熟

在研究中,该方法在血液细胞发育的数据上进行了测试,这是一个复杂的系统,其中干细胞可分化为多种不同类型的血液细胞。基于 MultistageOT 的结果的 UMAP 可视化显示,从多能祖细胞区域到细胞谱系入口点的伪时间值逐渐增加,并发生谱系分化,这些结果与造血干细胞和祖细胞分化成各种细胞类型的机制一致。

图片

图 2:基于 MultistageOT 的单细胞命运潜能和伪时间排序推断。

作为参考,团队还开发了一种简单的细胞命运预测器,称为逆距离加权(IDW)。IDW 方法不基于最优传输,而是使用到成熟细胞类型的相对欧几里得距离来推断细胞命运潜能。

在预测 Weinreb 等人标注为成熟细胞的命运这一简单任务中,每个模型的得分相似。具体来说,MultistageOT 在 98.1%的细胞中恢复了主导细胞命运。StationaryOT 和 IDW 分别达到了 97.8% 和 97.9% 的匹配率。

结果表明,MultistageOT 不仅能够重建发育轨迹,还能识别偏离预期过程的细胞——这是避免得出错误结论的必要机制。

从静态照片到动态生命

MultistageOT 是一个相当强大的工具,可以协助研究者理解细胞如何做出关于未来的「决策」。这种方法具有通用性,适用于不同的动物系统,乃至动物界之外。

团队希望未来的工作中,能够更多的利用组学数据,指导模型预测的荧光活细胞分选策略,以分离感兴趣的祖细胞。随后,通过细胞命运实验来探究和验证这些祖细胞的预测命运潜力。通过这种方法,研究者有了一种更能完整观测生命过程的途径。

相关资讯

谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析

编辑丨&细胞器经历不断的形态变化和动态相互作用,这是细胞稳态、应激反应和疾病进展的基础。 尽管细胞器的形态与运动十分重要,但由于其复杂的结构,高速的运动模式与目前现有分析技术的局限性,量化细胞器形态仍具有挑战性。 美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型,这是一种自动化且无偏倚的管道,用于分割、跟踪和提取不同细胞内结构的特征。
3/5/2025 12:57:00 PM
ScienceAI

ICML 2025 | AI虚拟细胞落地重大进展:清华AIR,水木分子等首创并开源多尺度空间转录组学基础大模型SToFM

作者 | 论文团队编辑 | ScienceAIAI 大模型竞赛风起云涌,垂直领域竞争激烈。 AI 基础大模型的能力正进一步向各科学研究领域渗透,而生物及生命科学就是 AI 大模型的下一个战场。 2025 年可以视为 AI 虚拟细胞元年。
8/27/2025 2:01:00 PM
ScienceAI

单细胞分析迈入新前沿:谷歌&耶鲁等发布270亿参数模型,为癌症治疗揭示全新潜在路径

编辑丨coisini今年早些时候,谷歌联合耶鲁大学等证实生物模型与自然语言处理类似,同样遵循扩展定律:模型规模越大,在生物学任务中的表现就越出色。 这引出了一个关键问题:扩大模型规模仅能提升现有任务性能,还是能催生全新能力? 谷歌认为:规模化的真正价值在于创造新思路、探索未知领域。
10/16/2025 2:42:00 PM
ScienceAI