AI在线 AI在线

AI预测细胞「未来命运」:Squidiff模型以扩散算法重建发育与药物响应轨迹

编辑丨&在显微镜下,研究者正在观察某个细胞的状态。 它可能正在分化、受药物作用,或者被辐射轻微损伤。 如果能预测它接下来会发生什么——会凋亡?
图片

编辑丨&

在显微镜下,研究者正在观察某个细胞的状态。它可能正在分化、受药物作用,或者被辐射轻微损伤。如果能预测它接下来会发生什么——会凋亡?转分化?恢复?——我们就能提前干预疾病、优化药物设计。

这一想法如今正在美国哥伦比亚大学(Columbia University)与斯坦福大学(Stanford University)等的研究团队手下变为现实。他们提出了一种名为 Squidiff 的基于扩散模型(diffusion model)的细胞状态预测框架,能在多种扰动条件下生成「未来的单细胞转录组」。

该研究以「Squidiff: predicting cellular development and responses to perturbations using a diffusion model」为题,于 2025 年 11 月 3 日刊登在《Nature Methods》。

图片

论文链接:https://www.nature.com/articles/s41592-025-02877-y

细胞系统中的 AI 视角

在单细胞生物学中,常用 RNA 测序(scRNA-seq)来观察细胞的基因表达谱。但这些数据只是静态快照——研究者只能看到「此刻的细胞」,却看不到它「接下来的变化」。

以往的算法如 scGenGEARS 尝试预测扰动后的状态,但都有局限:它们假设扰动与反应的关系是线性的;很难捕捉到细胞发育或药物反应中的非线性动态轨迹;对复杂多扰动(如药物联用、双基因编辑)往往失效。

Squidiff 的思路与之不同——它引入了扩散模型的时间逆推机制:通过学习细胞表达谱从「噪声」到「有序状态」的生成过程,模型不仅能还原静态数据,更能模拟状态转变的过程

图片

图 1:Squidiff 概述及其在合成数据上的性能。

Squidiff 可生成代表不同细胞状态的新转录组,并利用这些信息合并各种扰动条件,包括基因编辑和具有特定结构和剂量的药物化合物。接下来,它能在潜空间中逐步生成符合条件的未来表达谱。

Squidiff 集成了数据生成用的扩散模型和用于编码潜在表示的语义编码器,有了它,研究者就可以给模型「加一个条件」,例如「给予药物X」或「暴露在辐射剂量Y」,AI 就能输出该细胞在这些条件下的转录组预测

AI 模拟发育、药物与辐射三类扰动

为了解释 Squidiff 框架,研究者们在多个数据集上验证了 Squidiff 的能力。

以 iPSC 分化的公共单细胞转录组学数据集为例,仅根据第 0 天和第 3 天的数据进行训练,Squidiff 就通过扩散和去噪过程有效地捕获了从第 0 天到第 3 天从 iPSC 到中胚层和最终内胚层细胞的状态变化。

Squidiff 还可以预测细胞对基因扰动和药物治疗的反应。通过利用向量运算,训练完毕的 Squidiff 模型可以跨条件泛化单细胞转录组数据,准确模拟复杂的细胞反应。在双基因敲除实验(ZBTB25 + PTPN12)中,Squidiff 成功预测出下游信号的非线性叠加模式,性能显著优于 scGen 与 GEARS。

图片

图 2:Squidiff 预测细胞分化(部分)。

最后,团队将 Squidiff 应用于血管类器官(blood vessel organoid)暴露实验,模型准确再现辐射后炎症反应、p53 通路激活、细胞凋亡上调等转录信号,并进一步预测 G-CSF(粒细胞刺激因子)处理可显著缓解这些分子变化。

细胞的预测方式

Squidiff 模型打开了一条用生成式模型做生物学假设演化实验的道路。这意味着研究者可以在不动细胞、不开实验的情况下,模拟不同药物、剂量或辐射条件下的基因表达变化。

在药物开发中,它能用于筛选最可能有效的组合;在放射生物学中,它能预测剂量–响应曲线与修复窗口。Squidiff 不仅能成为治疗应用的工具,而且可以继续完善揭示细胞适应、应激反应和命运决定的根本机制的途径。

未来的工作中,提高 Squidiff 的可扩展性和计算效率对于将其应用于大规模数据集并确立 Squidiff 作为一个更通用的基础模型至关重要。它仍需要整合更多的多组学数据,以此完善其预测机制。

相关资讯

谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析

编辑丨&细胞器经历不断的形态变化和动态相互作用,这是细胞稳态、应激反应和疾病进展的基础。 尽管细胞器的形态与运动十分重要,但由于其复杂的结构,高速的运动模式与目前现有分析技术的局限性,量化细胞器形态仍具有挑战性。 美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型,这是一种自动化且无偏倚的管道,用于分割、跟踪和提取不同细胞内结构的特征。
3/5/2025 12:57:00 PM
ScienceAI

西湖大学郭天南解答AI虚拟细胞难题:在三重数据支持下的闭环学习系统

编辑丨&细胞是生命的基本单位,对于了解健康、衰老和疾病至关重要,是药物开发和合成生物学的重要研究对象。 基于细胞的实验需要大量资源,且出现突变的概率相当高,直接导致了生物医学实验中难以复现的困境。 通过数十亿年的进化,第一个碳基细胞出现在地球上,然而现如今借由虚拟技术,「硅基细胞」的发现与发展正在为科学界提供变革的机会。
4/10/2025 1:09:00 PM
ScienceAI

ICML 2025 | AI虚拟细胞落地重大进展:清华AIR,水木分子等首创并开源多尺度空间转录组学基础大模型SToFM

作者 | 论文团队编辑 | ScienceAIAI 大模型竞赛风起云涌,垂直领域竞争激烈。 AI 基础大模型的能力正进一步向各科学研究领域渗透,而生物及生命科学就是 AI 大模型的下一个战场。 2025 年可以视为 AI 虚拟细胞元年。
8/27/2025 2:01:00 PM
ScienceAI
  • 1