AI在线 AI在线

快270倍,精度超93%,浙大侯廷军、康玉团队等全新扩散生成模型,树立蛋白质-多肽对接新标准

编辑丨coisini蛋白质-多肽相互作用在细胞环境中无处不在,并在众多生物过程中发挥关键作用。 由于多肽具有免疫原性低、生产成本低等特点,在药物递送、医学影像、治疗制剂、靶向蛋白质降解及其他生物技术应用中常作为高效调节剂使用。 深入理解蛋白质-多肽相互作用机制,是开发多肽类治疗药物的基础。
图片

编辑丨coisini

蛋白质-多肽相互作用在细胞环境中无处不在,并在众多生物过程中发挥关键作用。

由于多肽具有免疫原性低、生产成本低等特点,在药物递送、医学影像、治疗制剂、靶向蛋白质降解及其他生物技术应用中常作为高效调节剂使用。

深入理解蛋白质-多肽相互作用机制,是开发多肽类治疗药物的基础。然而,这类相互作用具有弱结合性、瞬时性及环境依赖性等特点,使得蛋白质-多肽结合模式的高效虚拟筛选与结构表征面临巨大挑战。

最近,浙江大学侯廷军、康玉团队联合华盛顿大学、中南大学提出一种扩散生成模型 ——RAPiDock,在全原子水平上实现了理性、精准且快速的蛋白质-多肽分子对接。

研究论文以《Protein–peptide docking with a rational and accurate diffusion generative model》为题发表在《Nature Machine Intelligence》上。

图片

论文地址:https://www.nature.com/articles/s42256-025-01077-9

RAPiDock 概览

RAPiDock 模型通过引入物理约束条件有效缩小了采样空间,并采用双尺度图(bi-scale graph)在保证效率的同时捕获多维结构信息。RAPiDock 还创新性地基于 Clebsch-Gordan 张量积构建网络架构,确保模型具备物理对称性。

如下图所示,RAPiDock 工作流通过输入肽段序列与蛋白质结构,可生成多肽结合构象的分布作为输出。

图片

具体而言,RAPiDock 在对接涉及的自由度(包括肽段的全局平移、全局旋转以及主链 / 侧链扭转角)上定义了扩散过程。

图片

通过引入额外物理约束,RAPiDock 不仅有效缩小了采样空间,还提升了构象真实性。该研究采用双尺度图分别在残基和原子级别表征肽段,通过扩散过程将肽段构象从无信息的噪声先验分布逐步转化为有序的目标分布。

图片

该研究还开发了肽段初始结构构建器,可将一维肽序列转化为标准化的三维初始结构。

图片

这些策略使 RAPiDock 能在保持优异结构合理性的同时捕捉多层次相互作用细节。

不过,RAPiDock 也存在局限性。一方面,由于一些氨基酸的晶体学数据稀缺,模型训练样本不足,在处理这些氨基酸时精度有所下降,未来可能需要通过扩充修饰氨基酸数据集来解决该问题。

另一方面,由于依赖扩散模型,其迭代式扩散过程会产生较高计算负荷,后续研究可探索通过直接学习构象空间中的平滑轨迹来减少迭代次数。 

实验评估

实验表明,RAPiDock 能以极高精度和速度预测蛋白质-多肽对接模式,在多种几何特征上均能获得稳健对接结果,其性能显著优于 AF2Multi_RS、AF3 和 ADCP 等前沿方法。

进一步研究发现,RAPiDock 不仅能成功捕捉结合口袋(binding pockets)的精细结构信息、复现精确的肽结合模式,还可识别蛋白质内多个潜在的肽结合口袋。

图片

性能测试表明,RAPiDock 在精度与效率上均超越现有最优模型:在 RefPepDB-RecentSet 数据集的 Top-25 预测中,其肽段结合构象预测成功率达 93.7%(较 AF2Multi_RS 提升 13.4%),且单次对接仅需 0.35 秒(速度提升约 270 倍)。

大量案例研究证实,RAPiDock 能处理包括翻译后修饰(PTMs)在内的 92 种残基类型,灵敏识别细微对接模式,成为结构精准的高通量肽段虚拟筛选利器。

总的来说,RAPiDock 以卓越的精度和速度树立了蛋白质-多肽分子对接的新标准,在多重实际应用场景中拓展了高效蛋白质-多肽分子对接的技术边界。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

相关资讯

ACL 2025 | 湖南大学、腾讯生命科学实验室等提出蛋白互作预测新方法,让LLM学会解读蛋白质网络

编辑 | ScienceAI蛋白质是生命活动的「分子机器」,而蛋白质之间的相互作用(PPIs)更是细胞运转的核心机制 —— 从免疫反应到代谢调控,从疾病发生到药物研发,几乎所有生命过程都离不开 PPIs 的精密协作。 然而,传统实验手段解析 PPIs 成本高、周期长,如何通过 AI 技术高效预测 PPIs 的类型和亲和力,一直是生物信息学领域的重大挑战。 近日,来自湖南大学曾湘祥团队携手腾讯生命科学实验室,延世大学,和阿里国际提出了一种名为 LLaPA(Large Language and Protein Assistant)的多模态大语言模型,为破解这一难题提供了全新方案。
8/11/2025 2:04:00 PM
ScienceAI

Nature丨首个AI生成的基因编辑器,脱靶率更低、免疫更轻,兼容碱基编辑

编辑丨&在当下,基因编辑技术在科研工作中并不少见,不少疾病的药物研发、作物改良,都少不了它的技术支持。 源自微生物的 CRISPR 基因编辑器虽然强大,但在移植到非原生环境后,其「功能权衡」——或者说,在活性、特异性等方面的表现并不尽如人意。 基于这种现状,美国加利福尼亚的 Profluent Bio 工作室借助 AI 的辅助设计,构建了一个包含超过 100 万 CRISPR 操纵子的数据集,并提出了一种由人工智能生成的基因编辑器 OpenCRISPR-1,与碱基编辑兼容。
8/5/2025 2:10:00 PM
ScienceAI

多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现

编辑丨&在众多中下游任务中,收到广泛而多样的数据集训练的基础模型表现出的强大性能,在医疗领域表现却不甚得人心。 受到到数据量、异质性和隐私问题等问题的严重阻碍,基础模型得不到更进一步的发展。 桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight(VFMGL)框架,以促进各种医疗任务的专家临床模型的去中心化构建。
3/5/2025 5:48:00 PM
ScienceAI
  • 1