AI在线 AI在线

UC伯克利等利用AI结合物理约束推动药物设计,将原子碰撞率减少到0

编辑丨&随着人工智能的快速发展,基于结构的药物设计已经不复往日那般困难重重。 AI 系统在快速筛选潜在药物分子上展现出巨大的潜力,但现有模型常面临一个问题:即便是最先进的算法,有时也会给出与物理规律不符的设计方案。 比如在 AlphaFold 中,AI 虽然能精准预测蛋白质结构,但也偶尔提出不合理的折叠结构。
图片

编辑丨&

随着人工智能的快速发展,基于结构的药物设计已经不复往日那般困难重重。AI 系统在快速筛选潜在药物分子上展现出巨大的潜力,但现有模型常面临一个问题:即便是最先进的算法,有时也会给出与物理规律不符的设计方案。

比如在 AlphaFold 中,AI 虽然能精准预测蛋白质结构,但也偶尔提出不合理的折叠结构。在药物设计中,这种「非物理」结果同样会对药物筛选产生误导。

为了弥补这一缺陷,加州大学伯克利分校(University of California, Berkeley)与加州理工学院(California Institute of Technology)等的研究团队提出了NucleusDiff,一个引入物理学约束的创新 AI 模型,为药物设计提供了更加稳健的预测结果。

他们的研究结果以「Manifold-constrained nucleus-level denoising diffusion model for structure-based drug design」为题,发布在《Machine Learning in Chemistry》。

图片

论文链接:https://www.pnas.org/doi/10.1073/pnas.2415666122

物理约束方法

药物设计的核心在于找到能够与特定生物靶标紧密结合的小分子,以引发预期的生物学效应。AI 模型通过分析大量的蛋白质-配体结合数据,能预测哪些分子具有较高的结合亲和力

而在前文中所提到的 AlphaFold 等模型在面对训练数据之外的新分子时,往往无法保证生成的分子结构符合物理规律,特别是原子间距离过小或发生碰撞。换句话说,这些模型将原子视为一个质点,而非一片空间,忽视了分子中原子之间存在一个有效最小距离。

NucleusDiff 的核心创新就在此。它引入了物理学原理,特别是原子间距排斥力等概念,通过流形约束的去噪扩散模型,在保持分子结构合理性的同时,能够有效避免原子之间的碰撞。

图片

图 1:流形示意图与 NucleusDiff 流程。

NucleusDiff 流程分为两个阶段:首先结合物理先验的归纳偏差,将流形离散化为一组三角形网格点,并基于此调整原子核与采样网格点之间的距离与范德华半径相匹配。

它不直接计算每对原子间的距离,而是通过估算分子整体的空间流形,在此基础上确保重要原子之间保持合适的距离,避免任何物理上不可能的结构。这种方法大大提升了分子生成的精度与可靠性。

数据集上的应用

团队首先在 CrossDocked2020 数据集上采取了训练与测试,并从中得到了约 10 万个训练用蛋白质-配体结合复合物最终,与 100 个测试用复合物。

表 1:CrossDocked2020 中的性能测试结果。

图片

与 NucleusDiff 作对比的是研究领域的最先进模型 TargetDiff,从表格中可以很直观地看到:TargetDiff 在 700 步到 1000 步之间保持了稳定的原子碰撞比。相比之下,NucleusDiff 在这些推理步骤中表现出更低的比例,几乎将碰撞率减少到了 0。后者相较于前者此指标上拔高了一个数量级。

对于那 100 个测试用的蛋白质靶点,团队为其分别生成了 100 个 分子,在此基础上,NucleusDiff 在 14 个评估指标中有 8 个超过了所有基线模型,除了 QED、SA 和 Diversity。各项数据均表明:NucleusDiff 通过建模原子核与其周围流形之间的约束来防止原子碰撞,这对于生成高亲和力和现实可行的药物至关重要。

表 2:NucleusDiff 和 TargetDiff 在 3CL 靶点上的性能。

图片

在高亲和力配体方面,NucleusDiff 生成了 70.0% 的高亲和力配体,而 TargetDiff 为 50.5%,显示出明显的优势。这说明 NucleusDiff 在生成高亲和力配体方面更为有效,同时它与其他药物保持了设计标准的平衡,使其成为实际治疗应用的强有力候选者。

不仅仅依赖于训练数据

研究者表示,如果他们仅仅依赖训练数据,那么他们就并不能期待机器学习在显著不同于训练数据的例子上表现良好。在处理与训练数据不同的新例子时,许多机器学习模型无法得出准确的结果,但通过引入物理学,他们可以使机器学习更加可靠,并且工作得更好。

随着技术的不断进步,诸如 NucleusDiff 的设计思路有望扩展到更多领域,如蛋白质靶点预测、疾病诊断以及个性化医疗。未来,AI 与物理学的融合将在更广泛的科学研究中发挥重要作用,推动药物设计、材料科学、气候预测等多个领域的革新。

相关链接:https://phys.org/news/2025-10-ai-drug-physics.html

相关资讯

快速、精准且可解释的通用药物发现工作流LeadDisFlow:中国团队推动候选药物进入临床Ⅱ期

作者 | 论文团队编辑 | ScienceAI传统的靶向药物设计方法长期受限于三大关键瓶颈:初始化合物库的质量不高、湿实验筛选成本高昂以及活性预测模型可解释性差,这些瓶颈严重制约了新药发现的效率。 为突破这一行业难题,湖南大学、华东师范大学联合上海交通大学、华中科技大学等高校科研团队利用先进的分子图像技术,构建了一个快速、精准且可解释的靶向药物通用发现工作流程,旨在加速新药的研发进程。 研究成果以《Discovery of EP4 antagonists with image-guided explainable deep learning workflow》为题发表在《National Science Open》上。
7/18/2025 2:16:00 PM
ScienceAI

搞 AI,孩子必须学好数学:马斯克 Altman 罕见达成一致,LeCun / Jeff Dean 等 31 位大佬签署联名信

【新智元导读】基础数学已经被拔高到研究 AI 的必经之路!UC 伯克利教授发起最新倡议,31 位 AI 大佬共同签署联名信,马斯克和 Altman 竟达成一致。就在刚刚,UC 伯克利 EECS 教授 Jelani Nelson 联合发起了一个倡议,强调「坚实的数学基础对人工智能至关重要」。地址:「虽然 Elon Musk 和 Sam Altman 最近在很多问题上都有分歧,但他们都认同,AI 的构建是以代数和微积分等坚实的数学基础为支撑的。」目前,已经有 31 位业内大佬在上面签署了自己的名字。要想搞好 AI,就必
3/7/2024 9:56:48 PM
清源

NeurIPS 2024 Workshop 科学基础模型: 进展, 机遇, 挑战

Workshop背景人工智能 (AI) 和机器学习 (ML) 在科学领域的应用代表了传统科学发现方法的重大转变。几个世纪以来,探索自然世界的过程遵循着系统和逻辑的方法。然而,人工智能和机器学习技术的出现,正在深刻改变现代基础科学的发现方式。这种变化对于促进跨学科交流、激发创新的解决方案,并最终提高科学界应对现代科学中最紧迫和复杂问题的能力至关重要。与此同时,经过大量多样化数据集训练的基础模型,在计算机视觉和自然语言处理等任务中展示了强大的适应性。这些模型,例如语言模型 GPT-4 和图像文本处理模型 CLIP,通过
7/20/2024 3:30:00 PM
新闻助手
  • 1